본문 바로가기

Data Analysis/개인 프로젝트

(5)
[호텔 리뷰 분석 - 웹 스크래핑] 4. Process(3) 지난 포스팅에는 호텔 리뷰 분석 process 2번을 진행했었다. [Data Analysis/개인 프로젝트] - [호텔 리뷰 분석 - 웹 스크래핑] 3. Process(2) [호텔 리뷰 분석 - 웹 스크래핑] 3. Process(2) 지난 포스팅에는 호텔 리뷰 분석 process 1번을 진행했었다. [Data Analysis/개인 프로젝트] - [호텔 리뷰 분석] 2. Process(1) [호텔 리뷰 분석] 2. Process(1) 지난 포스팅에서는 호텔 리뷰 분석에 어떤 데이터 k-wien1589.tistory.com 이번 포스팅에선 마지막 process를 진행하려 한다. Process 3. 수집한 리뷰 고유 번호를 이용해서 목표 데이터 수집 - 리뷰의 (고유번호 / 작성자 id / 제목 / 게시 날짜..
[호텔 리뷰 분석 - 웹 스크래핑] 3. Process(2) 지난 포스팅에는 호텔 리뷰 분석 process 1번을 진행했었다. [Data Analysis/개인 프로젝트] - [호텔 리뷰 분석] 2. Process(1) [호텔 리뷰 분석] 2. Process(1) 지난 포스팅에서는 호텔 리뷰 분석에 어떤 데이터가 필요한지를 소개했었다. [Data Analysis/개인 프로젝트] - [호텔 리뷰 분석] 1. 어떤 데이터를 어떻게 분석할 것인가? [호텔 리뷰 분석] 1. 어떤 데 k-wien1589.tistory.com 이번 포스팅에선 process 2를 진행한다. Process 2. 리뷰 페이지에 부여된 url마다 반복되는 패턴이 있을 것이다. 그 패턴을 이용해서 1) 첫 페이지 ~ 마지막 페이지까지 접근 2) 리뷰 고유번호가 html 문서에서 어떤 클래스를 갖는지 ..
[호텔 리뷰 분석 - 웹 스크래핑] 2. Process(1) 지난 포스팅에서는 호텔 리뷰 분석에 어떤 데이터가 필요한지를 소개했었다. [Data Analysis/개인 프로젝트] - [호텔 리뷰 분석] 1. 어떤 데이터를 어떻게 분석할 것인가? [호텔 리뷰 분석] 1. 어떤 데이터를 어떻게 분석할 것인가? 호텔 리뷰를 분석하는 프로젝트를 진행해보려 한다. 분석할 리뷰는, 트립어드바이저(링크)에 등록된 그랜드하얏트 제주 호텔의 리뷰. 따로 데이터를 제공하지 않으니, 스크래핑으로 분석에 필 k-wien1589.tistory.com 이제 본격적으로 진행해보자. Process 1. 리뷰가 있는 메인 페이지의 url에 접근해서 1) 총 리뷰 개수 구하고 2) 총 페이지의 수를 구한다. * 구글 코랩 환경에서 진행한다. 스크래핑에 필요한 라이브러리를 import 한다. 필요한..
[호텔 리뷰 분석 - 웹 스크래핑] 1. 어떤 데이터를 어떻게 가져올 것인가? 호텔 리뷰를 분석하는 프로젝트를 진행해보려 한다. 분석할 리뷰는, 트립어드바이저(링크)에 등록된 그랜드하얏트 제주 호텔의 리뷰. 따로 데이터를 제공하지 않으니, 스크래핑으로 분석에 필요한 데이터를 추출해서 가져올 것이다. 필요한 데이터는 이렇다. - 리뷰의 (고유번호 / 작성자 id / 제목 / 게시 날짜 / 내용) - (가격 / 장소 / 객실 / 청결도 / 서비스 / 침대 퀄리티 / 종합) 평점 - 숙박 날짜 - 여행 유형 총 14종류의 데이터를 스크래핑으로 수집할 예정이다. 전체적인 프로세스는 다음과 같다. Process 1. 리뷰가 있는 메인 페이지의 url에 접근해서 1) 총 리뷰 개수 구하고 2) 총 페이지의 수를 구한다. Process 2. 리뷰 페이지에 부여된 url마다 반복되는 패턴이 있을..
[개인 데이터 분석 프로젝트] 지금까지 몇 개 간단하게, 개인 데이터 분석 프로젝트를 진행했었는데 해당 프로젝트들을 정리해서 이 카테고리에 올려보려 한다!