본문 바로가기
Data Analysis/R

[R] Daum 영화 평점을 가져와서 분석하기 - 1

by 불탄오징어 2016. 2. 23.
반응형

스크랩핑? 크로울링? 용어가 다소 생소하지만 웹상의 데이터를 가져오는 것을 스크래핑이라고 하는 것 같습니다. 정확한 용어는 찾아보고 다음에 정리해야지. 여튼


분석용 데이터를 구하기 위해서 웹상의 데이터를 많이 이용하는데 그중에 텍스트 데이터를 수집하기 위해서는 스크랩핑만한게 없는 것 같습니다. 보통 python을 이용을 많이 하는 것 같은데 본인은 R로 공부도 할겸 정리를 해봤습니다.


이용한 package는 rvest를 사용하여 Daum 영화 평점 및 Comment를 가져왔습니다. 웹상 데이터를 가져오기 위해서 해당 웹페이지에 대해 분석이 필요합니다. 먼저 현재 Daum 영화 평점 순위 페이지로 이동해 보면 다음과 같이 확인이 가능합니다. ==> 이동



여기서 녹색 부분의 평점과 코멘트가 필요한데 위의 부분에서 오른쪽 마우스 클릭한 후 "검사"를 클릭하면 다음의 내용이 보이는 창이 뜬다.



좌측 웹에서 마우스를 가져가면 우측에서 해당 부분이 하이라이트 되는데 그부분을 참조하여 구조를 파악하면 된다.

'Data Analysis > R' 카테고리의 다른 글

[R] Apply 함수를 알아보자  (0) 2020.04.21
[R] DAUM 영화 평점을 가져와서 분석하기 - 2  (0) 2016.02.23
[R] R 배치 프로그램  (2) 2016.01.07
R : Data.table 공부  (0) 2015.12.06
R : Rfacebook 패키지  (0) 2015.04.13

댓글