본문 바로가기

분류 전체보기

(184)
Project 4. HR 데이터를 통한 채용 기획하기 (2) 이 글은 24.02.15에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 4. HR 데이터를 통한 채용 기획하기 DBeaver - DB Insert DB부터 연결해주자. MySQL을 사용한다. 이제 데이터를 적재해보자 우선 DB 생성 데이터 가져오기 선택 다음 다음 다음... 을 누르면 데이터를 적재할 수 있다. SQL 분석 GROUP BY 부서, 직무, 직급 별 재직 인원수를 구해보자. 부서, 직무, 성별 재직 인원 수, 나이 최소값/최대값 구하기 논리연산자 최소 5년 이상 재직, 나이 30~45, 직급 3~4, HR소속 아닌 재직자 수 구하기 Adhoc Query(1) 작성 부서/직무/직급별로 재직 연수 5년 이상, 입사 이후 동일 직무에서 지속 근무, 최근 1년 내 승진 없는 사원 수..
Project 4. HR 데이터를 통한 채용 기획하기 (1) 이 글은 24.02.14에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 4. HR 데이터를 통한 채용 기획하기 시나리오 HR팀의 신입 데이터 분석가가 된 본인... 아래와 같은 업무를 맡게 되다! Python 데이터 훑어보기 데이터 불러오기 데이터 출처 : https://www.kaggle.com/datasets/rishikeshkonapure/hr-analytics-prediction Data import 1) import pandas as pd : DataFrame을 읽을 pandas import 2) from google.colab import drive drive.mount('content/drive') : colab과 내 google drive 연결 3) %cd '파일경로' : ..
Project 3. 고객행동 분석을 통한 서비스 헬스체크 이 글은 24.02.12에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 3. 고객행동 분석을 통한 서비스 헬스체크 주제 선정 이유 데이터셋 소개 고객 행동 데이터는 하나의 행이 하나의 행동을 나타낸다. 고객 행동 지표 AARRR 프레임워크 유입(Acquisition) 활성화(Activation) 유지(Retention) 추천(Referral) 수익(Revenue) 대시보드 제작(Tableau) 개요 활성유저 수 확인 - active user(DAU, WAU) 1) 활성 사용자가 몇이나 되는지 나타내보자. user id는 중복되면 안 된다. 2) 아래와 같이 계산된 필드를 만들자. COUNTD() => COUNT(DISTINCT )와 같다. 3) event time을 열에 올리고, 연/월/..
Project 2. 이커머스 데이터를 통한 사업 동향 파악 (3) 이 글은 24.02.09에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 2. 이커머스 데이터를 통한 사업 동향 파악 Tableau로 나타내기 전년 대비 성장률 보기 전년 대비 성장률이 중요한 이유? => 분석 시에는 비교 시점을 설정하는것이 중요하다. => 각 연도별로 성수기/비수기가 있을 것이다. 성수기는 성수기, 비수기는 비수기끼리 비교해야 성장률이 어느 정도인지 정확하게 알 수 있기 때문이다. 자주 쓰이는 용어들 - YoY(Year of Year) : 전년 비교 - MoM(Month of Month) : 전월 비교 - WoW(Week of Week) : 전주 비교 태블로로 나타내보자. 연도별, 월별 매출 테이블(YTD 총계에서 YTD값만 제거하면 된다)에서 시작. 1) 마크의 합계 ..
Project 2. 이커머스 데이터를 통한 사업 동향 파악 (2) 이 글은 24.02.08에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 2. 이커머스 데이터를 통한 사업 동향 파악 Ad hoc Ad hoc이란? 일반적으로 특정한 목적이나 계획에 따라 미리 정의된 쿼리나 분석이 아니라, 필요에 따라 임시로 데이터를 분석하거나 나타내는 것을 의미한다. 특징 비구조적 : 데이터 미리 정의 없이 활용 가능한 분석 즉각적인 요구 : 긴급 문제 해결 및 특별 질문에 활용 유연성 : 유연한 데이터 접근과 빠른 분석 가능 일회성 : 일회성 작업, 결과물을 재사용하는 경우는 많지 않음. 즉, 주기적으로 들어오는 데이터로 시각화하여 모니터링하는 것과는 다르게 데이터 요청에 따라서 일회성으로 지표를 보는 것 Big Query Ad hoc 분석 1. 가장 고객이 많은 지역..
Project 2. 이커머스 데이터를 통한 사업 동향 파악 (1) 이 글은 24.02.06에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 2. 이커머스 데이터를 통한 사업 동향 파악 주제 선정 이유 비즈니스는? 측정되어야 한다. => 분석가들은 지표와 친해야 한다! => 지표와 친하다?? -> 지표를 접근 가능한 단위로 쪼개자! => 근본적인 문제가 어떤 지표에 있는지 최대한 자세하게 알기 위함이다 사용할 데이터셋 https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce Big Query 준비 빅쿼리 검색 후 링크 접속(GCP 제품이므로 설치할 필요 없음) 새 프로젝트 만들기 => 빅쿼리에서는 "프로젝트-> 데이터셋 -> 테이블"의 계층 구조로 데이터셋을 관리할 수 있음 프로젝트 만든 후, SQL 쿼리 ..
Project 1. 공공 데이터를 통한 시장 동향 이해 (3) 이 글은 24.02.05에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Looker studio 루커 스튜디오의 장점 1) 쉽고 빠르게 데이터 소스를 연결할 수 있다(특히 구글제품의 경우) 2) 공유와 공동작업이 편하다 3) 리포팅도 편하다 4) 무엇보다, 공짜다! 환경 세팅하기 구글 클라우드 플랫폼에 속하는 제품이라, 별도의 설치 없이 웹에서 바로 사용 가능 https://lookerstudio.google.com/navigation/reporting 만들기를 누르면 다음과 같이 정보를 입력하는 창이 뜬다. 적당히 입력해주자(회사명을 비워두라고 되어 있지만, 비우면 아래의 계속 버튼이 비활성화되어 다음 단계로 넘어갈 수 없다) 정보를 입력하고 나면 아래와 같이 굉장히 여러 데이터 소스에 연결할 수 있..
Project 1. 공공 데이터를 통한 시장 동향 이해 (2) 이 글은 24.02.01에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 1. 공공 데이터를 통한 시장 동향 이해(대시보드 제작) 1.4 대시보드 설계 원칙 1.4.1 Tableau 전처리를 마친 3개의 csv파일을 모두 구글 스프레드시트에 올려주자. 태블로와 스프레드 시트 연결 후 워크시트 열기 상품군 별 거래액 하이라이트 테이블 만들기 => '상품군별' 차원을 행에 올리기(혹은 더블클릭) => 'Sales' 값을 텍스트 마크에 올리기(혹은 더블클릭) => 'Sales' 값을 색상 마크에 올리고 '자동'으로 되어 있는 마크 값을 사각형으로 바꾸기