본문 바로가기

Data Analysis

(27)
Project 4. HR 데이터를 통한 채용 기획하기 (4) 이 글은 24.02.20에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 4. HR 데이터를 통한 채용 기획하기 DBeaver는 잠시 안녕~ Power BI를 다뤄 보도록 하자. 시각화 시각화 시각화 ! Power BI csv 데이터 가져오기 메인 화면에서, 사진과 같이 상단의 데이터 가져오기 - 텍스트/CSV 선택 후 원하는 csv 데이터 선택. ...하면 이런 화면이 나오는데, 로드를 누르면 csv데이터를 Power BI에 불러올 수 있고, 우측에 다음과 같이 표시된다 MySQL DB 데이터 가져오기 메인 화면 상단의 데이터 가져오기 아이콘 클릭(화살표 클릭 후 '자세히'를 눌러도 됨) - MySQL DB 선택 그러고 나면 아래와 같은 화면이 나올 것이다. 입력할 거 입력해주자. 서버 ..
Project 4. HR 데이터를 통한 채용 기획하기 (3) 이 글은 24.02.19에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 4. HR 데이터를 통한 채용 기획하기 지난번 내용에 이어서... DBeaver에 MySQL을 연결해서 사용하고 있다! SQL분석 Ad hoc Query(2) 연봉 협상 전에 전 직원들에게(당연히 재직자들) 내년 예상 연봉 고지를 하기로 한다. 아래 조건에 맞춰서 Salary 관련 지표를 집계하도록 하라. 지표 : 부서/직급/직무 별 평균 월급과 평균 Salary 인상률과 부서/직급/직무 별 내년 추정 월급 및 추정 연봉 1) 부서, 직급, 직무 별 평균 월급과 평균 Salary 인상률 2) 부서, 직급, 직무 별 내년 추정 월급 및 추정 연봉 3) 올해 승진자가 있는 그룹 대상으로 내년 추정연봉이 20만 이상인 그룹..
Project 4. HR 데이터를 통한 채용 기획하기 (2) 이 글은 24.02.15에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 4. HR 데이터를 통한 채용 기획하기 DBeaver - DB Insert DB부터 연결해주자. MySQL을 사용한다. 이제 데이터를 적재해보자 우선 DB 생성 데이터 가져오기 선택 다음 다음 다음... 을 누르면 데이터를 적재할 수 있다. SQL 분석 GROUP BY 부서, 직무, 직급 별 재직 인원수를 구해보자. 부서, 직무, 성별 재직 인원 수, 나이 최소값/최대값 구하기 논리연산자 최소 5년 이상 재직, 나이 30~45, 직급 3~4, HR소속 아닌 재직자 수 구하기 Adhoc Query(1) 작성 부서/직무/직급별로 재직 연수 5년 이상, 입사 이후 동일 직무에서 지속 근무, 최근 1년 내 승진 없는 사원 수..
Project 4. HR 데이터를 통한 채용 기획하기 (1) 이 글은 24.02.14에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 4. HR 데이터를 통한 채용 기획하기 시나리오 HR팀의 신입 데이터 분석가가 된 본인... 아래와 같은 업무를 맡게 되다! Python 데이터 훑어보기 데이터 불러오기 데이터 출처 : https://www.kaggle.com/datasets/rishikeshkonapure/hr-analytics-prediction Data import 1) import pandas as pd : DataFrame을 읽을 pandas import 2) from google.colab import drive drive.mount('content/drive') : colab과 내 google drive 연결 3) %cd '파일경로' : ..
Project 3. 고객행동 분석을 통한 서비스 헬스체크 이 글은 24.02.12에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 3. 고객행동 분석을 통한 서비스 헬스체크 주제 선정 이유 데이터셋 소개 고객 행동 데이터는 하나의 행이 하나의 행동을 나타낸다. 고객 행동 지표 AARRR 프레임워크 유입(Acquisition) 활성화(Activation) 유지(Retention) 추천(Referral) 수익(Revenue) 대시보드 제작(Tableau) 개요 활성유저 수 확인 - active user(DAU, WAU) 1) 활성 사용자가 몇이나 되는지 나타내보자. user id는 중복되면 안 된다. 2) 아래와 같이 계산된 필드를 만들자. COUNTD() => COUNT(DISTINCT )와 같다. 3) event time을 열에 올리고, 연/월/..
Project 2. 이커머스 데이터를 통한 사업 동향 파악 (3) 이 글은 24.02.09에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 2. 이커머스 데이터를 통한 사업 동향 파악 Tableau로 나타내기 전년 대비 성장률 보기 전년 대비 성장률이 중요한 이유? => 분석 시에는 비교 시점을 설정하는것이 중요하다. => 각 연도별로 성수기/비수기가 있을 것이다. 성수기는 성수기, 비수기는 비수기끼리 비교해야 성장률이 어느 정도인지 정확하게 알 수 있기 때문이다. 자주 쓰이는 용어들 - YoY(Year of Year) : 전년 비교 - MoM(Month of Month) : 전월 비교 - WoW(Week of Week) : 전주 비교 태블로로 나타내보자. 연도별, 월별 매출 테이블(YTD 총계에서 YTD값만 제거하면 된다)에서 시작. 1) 마크의 합계 ..
Project 2. 이커머스 데이터를 통한 사업 동향 파악 (2) 이 글은 24.02.08에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 2. 이커머스 데이터를 통한 사업 동향 파악 Ad hoc Ad hoc이란? 일반적으로 특정한 목적이나 계획에 따라 미리 정의된 쿼리나 분석이 아니라, 필요에 따라 임시로 데이터를 분석하거나 나타내는 것을 의미한다. 특징 비구조적 : 데이터 미리 정의 없이 활용 가능한 분석 즉각적인 요구 : 긴급 문제 해결 및 특별 질문에 활용 유연성 : 유연한 데이터 접근과 빠른 분석 가능 일회성 : 일회성 작업, 결과물을 재사용하는 경우는 많지 않음. 즉, 주기적으로 들어오는 데이터로 시각화하여 모니터링하는 것과는 다르게 데이터 요청에 따라서 일회성으로 지표를 보는 것 Big Query Ad hoc 분석 1. 가장 고객이 많은 지역..
Project 2. 이커머스 데이터를 통한 사업 동향 파악 (1) 이 글은 24.02.06에 본인 벨로그에 작성했던 글을 옮겨 온 것이다. Project 2. 이커머스 데이터를 통한 사업 동향 파악 주제 선정 이유 비즈니스는? 측정되어야 한다. => 분석가들은 지표와 친해야 한다! => 지표와 친하다?? -> 지표를 접근 가능한 단위로 쪼개자! => 근본적인 문제가 어떤 지표에 있는지 최대한 자세하게 알기 위함이다 사용할 데이터셋 https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce Big Query 준비 빅쿼리 검색 후 링크 접속(GCP 제품이므로 설치할 필요 없음) 새 프로젝트 만들기 => 빅쿼리에서는 "프로젝트-> 데이터셋 -> 테이블"의 계층 구조로 데이터셋을 관리할 수 있음 프로젝트 만든 후, SQL 쿼리 ..