본문 바로가기

Data Analysis/Data Analysis

Project 4. HR 데이터를 통한 채용 기획하기 (4)

이 글은 24.02.20에 본인 벨로그에 작성했던 글을 옮겨 온 것이다.

 

 

Project 4. HR 데이터를 통한 채용 기획하기

 

DBeaver는 잠시 안녕~
Power BI를 다뤄 보도록 하자.
시각화 시각화 시각화 !

 

Power BI

csv 데이터 가져오기

메인 화면에서, 사진과 같이 상단의 데이터 가져오기 - 텍스트/CSV 선택 후 원하는 csv 데이터 선택.


...하면 이런 화면이 나오는데, 로드를 누르면 csv데이터를 Power BI에 불러올 수 있고, 우측에 다음과 같이 표시된다

 

MySQL DB 데이터 가져오기

메인 화면 상단의 데이터 가져오기 아이콘 클릭(화살표 클릭 후 '자세히'를 눌러도 됨) - MySQL DB 선택


그러고 나면 아래와 같은 화면이 나올 것이다. 입력할 거 입력해주자.

서버 : 개인이라면 대개는 localhost일 것이다.

데이터베이스 : 내가 가져올 데이터가 들어있는 스키마의 이름

고급 옵션 - SQL문 : 안 써줘도 상관은 없으나, 써주지 않고 바로 확인을 눌러서 데이터를 불러오게 되면 모든 데이터를 다 가져오게 되므로, 스키마 내의 데이터가 많다면 오래 걸릴 수 있다. 그러므로 사진처럼 간단한 쿼리문을 통해 내가 쓸 데이터만 가져오는 것이 효율적이다.


확인 버튼을 눌러주면 아래와 같이 사용자 이름과 PW를 입력하게끔 창이 뜬다. 입력해주면 데이터를 불러올 수 있다.



상단의 데이터 변환을 눌러보자. csv로 가져온 데이터, 쿼리로 가져온 데이터가 각각 표시된다.



우측 '적용된 단계'에 보이는 톱니를 눌러보면 내가 이 데이터를 가져올 때 사용한 쿼리문을 볼 수 있는데, 여기서도 쿼리문을 수정할 수 있다. 수정하면, 그대로 데이터가 수정되어서 다시 로드된다.

 

데이터 다뤄보기 - 데이터 변환

상단의 데이터 변환을 누르면 Power Query 편집기가 뜬다.



1. 열 추가 : 말 그대로 열(컬럼)을 추가해주는 것이다. 여러 방법으로 열을 추가해줄 수 있다.

1) 예제의 열
무슨 뜻이냐?? 이미 존재하는 특정 열(컬럼)을 '예제'로 삼아, 새로운 열을 추가하겠다는 것이다.
예를 들어 이미 존재하는, 퇴직 여부를 나타내는 Attrition 컬럼의 값이 Yes / No 뿐이어서 보기 힘들다고 해보자. 좀 더 직관적으로 Retired / Working이었으면 좋겠다.
즉, Attrition의 값이 Yes인 행의 값은 Retired고 Attrition의 값이 No인 행의 값은 Wroking인 열을 만들고 싶은 것이다. 이럴 때에 예제의 열 기능을 활용한다.
예제로 삼을 열을 선택한 후 예제의 열 - '선택 항목에서' 선택



그 후 맨 오른쪽에 열1 이라는 새로운 열이 생긴다. 사진에서는 Attrition의 값이 Yes라는 것을 보여주고 있다. 여기에 Retired를 입력하고, Attrition이 No인 행에 Working을 입력하면??



Power BI가 자동으로 logic을 짜서 나머지 값들도 채워지는 것을 볼 수 있다.


확인을 누르면 맨 오른쪽에 해당 열이 추가되고, 조건 열이 추가됨 이라고 표시된 것을 확인할 수 있다.



2) 조건 열
상단의 조건 열을 선택하면 아래와 같이 직접 조건을 걸어주어 열을 추가할 수 있는 창이 뜬다.

그럼 이런 저런 조건을 걸고 열을 추가하면 된다



2. 열 병합/분할

1) 병합
파워 쿼리 편집기에서, 합치고자 하는 열들을 선택 후 상단의 열 추가 - 열 병합을 선택하면, 아래와 같은 화면이 나온다. 구분 기호는 여러가지 지정할 수 있다.


2) 열 분할
분할할 열 우클릭 - 열 분할. 역시 여러가지 방법으로 열을 나눌 수 있다.



3. 문자 데이터 다루기

파워 쿼리 편집기 상단의 변환 탭에서 '텍스트'파트에서 조작할 수 있다.

1) 서식
보다시피 소문자, 대문자, 기타 등등이 보이는데 굉장히 직관적인 네이밍이라서 해 보기 전에도 무슨 메뉴인지 알 수 있을 것이다.



2) 추출
이 역시도 무슨 기능을 하는지 굳이 해 보지 않아도 알 수 있으리라 생각한다.



4. 숫자 데이터 다루기

파워 쿼리 편집기 상단의 변환 탭에서 '숫자'파트에서 조작할 수 있다.

통계, 연산, 지수 연산, 기타 등등의 조작을 할 수 있다.