帶data.table的一個組的子集假設我有一個包含一些棒球運動員的數據表:library(plyr)library(data.table)bdt <- as.data.table(baseball)對于每個玩家(由id給出),我希望找到與他們玩游戲最多的年份相對應的行。這在plyr中很簡單:ddply(baseball, "id", subset, g == max(g))data.table的等效代碼是什么?我試過:setkey(bdt, "id") bdt[g == max(g)] # only one rowbdt[g == max(g), by = id]
# Error: 'by' or 'keyby' is supplied but not jbdt[, .SD[g == max(g)]] # only one row這樣做是可行的:bdt[, .SD[g == max(g)], by = id]但它只比plyr快30%,說明它可能不是慣用的。
1 回答

素胚勾勒不出你
TA貢獻1827條經驗 獲得超9個贊
data.table
bdt[bdt[, .I[g == max(g)], by = id]$V1]
.SD
編輯:.SD
[.data.table
by
- 1 回答
- 0 關注
- 440 瀏覽
添加回答
舉報
0/150
提交
取消