Data Analysis/R
R : Wordcloud (미완)
불탄오징어
2013. 8. 30. 11:08
ㅁ wordcloud : wordcloud 생성 명령어, wordcloud 패키지를 install하면 사용할 수 있다.
ㅁ 기본 사용방법
- wordcloud(단어, 각 단어 빈도수) : 각 단어 빈도수 만큼 wordcloud 출력
- wordcloud(문장 or 글) : 글내에서 각 단어의 빈도수 만큼 자동 추합하여 wordcloud 출력
ㅁ 실제 유의미한 wordcloud를 출력하려면 textmining 패키지를 사용하여 데이터 정제가 필요할 것 같다.
예를 들면 구두점(아직 정확히 의미를 모르겠다)이나 조사 같은 것들을 제외한 후 실제 의미를 가지는 단어들로 정리하는 것.
ㅁ 이런 정제를 위해 textmining에서는 여러가지 함수를 제공한다.
- extractNoun(pkg - KoNLP), removeNumbers, removePunctuation, stripWhitespace