본문 바로가기

Data Analysis/R28

R : Facebook 데이터로 Word Cloud 그리기.. 트위터 글로는 Word Cloud 그리는건 많지만 페이스북은 잘 안보여서 뚝딱뚝닥 해봤다. (일단 트위터는 Oauth가 바껴서 귀찮.... 페이스북은 Access Token만 있으면 돼서..) 내가 좋아하는 골프존의 페이스북에 올라온 포스트에 대해서 Word Cloud를 만들었다. 만드는 김에 데이터 가져올때 likes 카운트도 가지고 왔는데 나중에 쓸모가 있겠지... 역시 ..... 골프존이라 골프가 제일커.... # facebook 데이터를 가져오기 위해서는 permission이 필요하고 전체 newsfeed를 가져오려면 권한 중 read_stream 권한이 필요하다. access_token 2013. 9. 24.
R : R script에서 다른 R script 가지고 오기(Source) R 스크립트가 길어지거나 나만의 함수 같은 것을 따로 만들어놨다면 따로 저장해두고 불러오는 방법이 편하다. 예전에 SAS로 프로젝트를 할 때는 작업용 Macro 함수를 몇개 만들어 두고 다 따로 저장을 해둬서 필요할 때마다 Include하는 방식으로 했었는데... R 도 비슷한 명령어가 있다. source("[R 스크립트 경로]") source("D:\Rstudy\test.r") 특이한 점은 기본적으로 사용하는 Plot()의 경우 Source로 불러오면 차트가 출력되지만 ggplot()은 출력이 되지 않는다. 물론 변수로 받은 후에 다시 호출하면 출력이 되지만... 회사에서 Spotfire와 R 같의 연동을 할 일이 많으니 종종 문의 들어오는 것이 Script가 1,000 줄 이상이면 어떻게 하냐? 일일.. 2013. 9. 10.
R : 문자로 된 날짜를 Date Type으로 변경하기(as.Date(), strptime()) 문자로 된 날짜를 Date Type으로 변경하는 방법을 정리해보자. (자꾸 까먹어서 따로 정리 좀 ...) 사용방법은 동일한 두 함수가 있다. as.Date(), strptime() x1 2013. 9. 9.
R : get 함수 get 함수는 문자열에 해당하는 R 객채를 반환한다. get(paste("a_",i,sep="") for(i in 1:10) { get(paste("a_",i,"sep="") } 예 : get(paste("a_", i, sep="") SAS에서 재미있고 강력한 기능이 매크로인데 현재 떠오르는 건 세스 Macro 변수처럼 쓸 수 있겠다는 생각밖에 안든다.(아무래도 SAS로 3년간 일하다보니 아직 SAS 기준... ) 물론 다른 함수들 처럼 다양하게 쓸 수 있겠지만.. 2013. 9. 3.
R : 시계열 관련 함수 1. Arima : ARIMA 모형 추정을 위한 함수 arima(x, order = c(0, 0, 0), seasonal = list(order = c(0, 0, 0), period = NA), xreg = NULL, include.mean = TRUE, transform.pars = TRUE, fixed = NULL, init = NULL, method = c("CSS-ML", "ML", "CSS"), n.cond, optim.method = "BFGS", optim.control = list(), kappa = 1e6) 2. ACF, PACF acf(x, lag.max = NULL, type = c("correlation", "covariance", "partial"), plot = TRUE, na... 2013. 9. 3.
R : Wordcloud (미완) ㅁ wordcloud : wordcloud 생성 명령어, wordcloud 패키지를 install하면 사용할 수 있다. ㅁ 기본 사용방법 - wordcloud(단어, 각 단어 빈도수) : 각 단어 빈도수 만큼 wordcloud 출력 - wordcloud(문장 or 글) : 글내에서 각 단어의 빈도수 만큼 자동 추합하여 wordcloud 출력 ㅁ 실제 유의미한 wordcloud를 출력하려면 textmining 패키지를 사용하여 데이터 정제가 필요할 것 같다. 예를 들면 구두점(아직 정확히 의미를 모르겠다)이나 조사 같은 것들을 제외한 후 실제 의미를 가지는 단어들로 정리하는 것. ㅁ 이런 정제를 위해 textmining에서는 여러가지 함수를 제공한다. - extractNoun(pkg - KoNLP), re.. 2013. 8. 30.
R : Twitter OAuth for R Twitter OAuth 정책이 바뀌었다나 어쨌다나 Twitter에 대한 기능들을 쓰려면 OAuth를 받아야 한단다. 1. https://dev.twitter.com/apps/new 에서 새로운 App으로 등록2. OAuth 관련된 정보들을 생성할 수 있는데 이를 이용해서 아래의 스크립트를 실행한다. library(twitteR) cainfo 2013. 8. 30.
R : Facebook 데이터 가져오기 트위터에서 데이터를 가져오는 걸 찾아보다 Facebook도 가능하지 않을까 해서 찾아보다가 Facebook Graph API를 사용하는 것을 알게 되었다. 역시나 트위터 처럼 Access Token이 필요하다. 트위터보다는 발급이 아주 간단함 https://developers.facebook.com/tools/explorer 위 주소로 가서 Access Token을 발급하여 사용하면 된다. 이때 권한을 체크 해줘야 하는데 News Feed 값을 모두 가져오려면 Read Stream 권한을 꼭 체크해줘야한다.(이걸 몰라서 왜 글이 다 안나오는 지 심각하게 고민함 ㅠㅠ) 그럼 아래와 같은 간단한 Function을 통해서 Facebook 에서 데이터를 가져 올 수 있다.(솔직히 함수 수준은 아니지만... 앞으.. 2013. 8. 29.