Ad hoc이란? 일반적으로 특정한 목적이나 계획에 따라 미리 정의된 쿼리나 분석이 아니라, 필요에 따라 임시로 데이터를 분석하거나 나타내는 것을 의미한다.
특징 비구조적 : 데이터 미리 정의 없이 활용 가능한 분석 즉각적인 요구 : 긴급 문제 해결 및 특별 질문에 활용 유연성 : 유연한 데이터 접근과 빠른 분석 가능 일회성 : 일회성 작업, 결과물을 재사용하는 경우는 많지 않음.
즉, 주기적으로 들어오는 데이터로 시각화하여 모니터링하는 것과는 다르게 데이터 요청에 따라서 일회성으로 지표를 보는 것
Big Query Ad hoc 분석
1. 가장 고객이 많은 지역은?
주(state)별 침투율(비중, 점유율, 인구대비 고객 등)을 확인하고 침투율이 현저히 낮은 지역을 중심으로 침투율을 개선하고자 한다. 이를 위한주별 고객 수와 주문 수를 출력하라.
2. 고객 수 Top2 state
주(state)별 주문수를 출력해야 한다. 고객 수가 Top2인 상파울루(SP), 리우데자네이루(RJ) 만 출력하라(서브쿼리를 이용한 JOIN)
3. 순위 매기기
지역별 광고 캠페인을 진행하려 한다. 고객이 많은 지역부터 전략을 짜려 하는데, 이를 위해2017년의 도시별 주문 수와 고객 수, 매출을 출력하라. - 조건 1.고객 수 기준으로 순위 매길 것. - 조건 2.전체 순위와 주(state) 내에서의 순위 둘 다. - 조건 3.배송 완료된 건만 집계할 것.
순위...순위를 어떻게 매겨야 할까?
순위 매기는 법도 알았겠다, 조건에 맞는 쿼리를 짜서 결과를 출력해보자
4. 우리 고객들의 월 객단가는?
우리 고객들은 월 평균 얼마를 쓰고 있는지 출력하라.
단, 서비스 성격에 따라 구매 주기는 한달이 될 수도 두달이 될 수도, 그보다 더 길 수도 있으니 이렇게 기간을 설정할 때엔 비즈니스의 성격을 고려할 필요가 있다.
구해보자
5. 고객군 분류하기
고객들을 월별 구입금액 기반으로 나누고, 각 그룹별 비중의 변화 양상을 보고자 한다. 월 - 고객 ID - 해당 월 구매금액 - 그룹 순으로 출력 * 금액 300 이상은 A, 150~300은 B, 그 외는 C그룹에 할당. * order status는 delivered, shipped만 취급.
Tableau로 나타내기
지난 5일차에 대시보드 제작용으로 준비한 데이터를 사용 할 것이다. 여차저차해서 태블로와 구글 스프레드 시트를 연동시켜 해당 데이터를 불러오는것에서 시작한다.
누적 매출
1) 연도별 월별 매출표시하기
2) 이렇게 하면 그래프가 간단하게 누적합을 표시하게 된다.
어떤 식으로 수식이 걸려있는지 보자. 아래와 같이 직접 수식을 작성해도 누적합을 구할 수 있다.