亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

刪除重復行

刪除重復行

GCT1015 2019-06-21 15:23:40
刪除重復行我讀過CSV文件放入R數據幀中。一些行在其中一個列中具有相同的元素。我想刪除該列中重復的行。例如:platform_external_dbus          202           16                     google        1platform_external_dbus          202           16         space-ghost.verbum        1platform_external_dbus          202           16                  localhost        1platform_external_dbus          202           16          users.sourceforge        8platform_external_dbus          202           16                    hughsie        1我只想要這些行中的一行,因為其他行在第一列中有相同的數據。
查看完整描述

3 回答

?
冉冉說

TA貢獻1877條經驗 獲得超1個贊

只需將數據幀與所需的列隔離,然后使用唯一的函數:d。

# in the above example, you only need the first three columnsdeduped.data <- unique( yourdata[ , 1:3 ] )
# the fourth column no longer 'distinguishes' them, # so they're duplicates and thrown out.


查看完整回答
反對 回復 2019-06-21
?
慕斯王

TA貢獻1864條經驗 獲得超2個贊

對于來此尋找重復行刪除的一般答案的人,請使用!duplicated():


a <- c(rep("A", 3), rep("B", 3), rep("C",2))

b <- c(1,1,2,4,1,1,2,2)

df <-data.frame(a,b)


duplicated(df)

[1] FALSE  TRUE FALSE FALSE FALSE  TRUE FALSE  TRUE


> df[duplicated(df), ]

  a b

2 A 1

6 B 1

8 C 2


> df[!duplicated(df), ]

  a b

1 A 1

3 A 2

4 B 4

5 B 1

7 C 2

答復:從R數據幀中刪除重復行


查看完整回答
反對 回復 2019-06-21
?
牛魔王的故事

TA貢獻1830條經驗 獲得超3個贊

功能distinct()dplyr包執行任意重復刪除,允許指定重復變量(如本問題)或考慮所有變量。

數據:

dat <- data.frame(a = rep(c(1,2),4), b = rep(LETTERS[1:4],2))

刪除指定列重復的行:

library(dplyr)dat %>% distinct(a, .keep_all = TRUE)

  a b1 1 A2 2 B

刪除與其他行完全重復的行:

dat %>% distinct

  a b1 1 A2 2 B3 1 C4 2 D


查看完整回答
反對 回復 2019-06-21
  • 3 回答
  • 0 關注
  • 756 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號