본문 바로가기
Data Analysis/R

R : Data.table 공부

by 불탄오징어 2015. 12. 6.
반응형

R에서 여러 유용한 패키지가 많은데 Data.table을 단연코 최고가 아닐까 생각한다.

다만 기존 Data.frame과 달리 유용한 반면 사용법이 달라서 매번 까먹거나 헷갈리네...

조금 공부도 할경 정리도 할겸 포스트를 써보았다.

조금씩 추가하면서 정리해야겠다.


library(data.table)

# Data load
dt <- data.table(rbind(airquality,airquality,airquality,airquality))

# New Column
dt[,test:="chk"]
dt[Ozone < 30, test:="None"]
dt[,Date:=as.Date(paste('2015', as.character(Month), as.character(Day), sep='/'),'%Y/%m/%d')]

# Search
dt[Ozone < 30]
dt[Solar.R > 150 & Ozone < 20 ]
dt[Ozone %between% c(11,14)]
dt[test == "None"]
dt[test %like% "^N"]
dt[test %chin% "None"]

# Join
DT = data.table(x=rep(c("a","b","c"),each=3), y=c(1,3,6), v=1:9)
setkey(DT, x)

X = data.table(c("b","c"),foo=c(4,2))

DT[X]
DT[X,sum(v), by=x]

# Expression
DT[,sum(v), by=.(y%%2)]
DT[,v/sum(v), by=x]
DT[,length(y)/nrow(.SD), by=y]

'Data Analysis > R' 카테고리의 다른 글

[R] Daum 영화 평점을 가져와서 분석하기 - 1  (2) 2016.02.23
[R] R 배치 프로그램  (2) 2016.01.07
R : Rfacebook 패키지  (0) 2015.04.13
R : Text Mining...  (0) 2015.02.04
프로젝트 하면서 매번 느끼는 건데  (0) 2014.12.31

댓글