已解決430363個問題，去搜搜看，總會有你想問的

刪除重復行

首頁猿問刪除重復行

刪除重復行

R語言

GCT1015 2019-06-21 15:23:40

刪除重復行我讀過CSV文件放入R數據幀中。一些行在其中一個列中具有相同的元素。我想刪除該列中重復的行。例如：platform_external_dbus 202 16 google 1platform_external_dbus 202 16 space-ghost.verbum 1platform_external_dbus 202 16 localhost 1platform_external_dbus 202 16 users.sourceforge 8platform_external_dbus 202 16 hughsie 1我只想要這些行中的一行，因為其他行在第一列中有相同的數據。

查看完整描述

3 回答

冉冉說

TA貢獻1877條經驗獲得超1個贊

只需將數據幀與所需的列隔離，然后使用唯一的函數：d。

# in the above example, you only need the first three columnsdeduped.data <- unique( yourdata[ , 1:3 ] )
# the fourth column no longer 'distinguishes' them, # so they're duplicates and thrown out.

反對回復 2019-06-21

慕斯王

TA貢獻1864條經驗獲得超2個贊

對于來此尋找重復行刪除的一般答案的人，請使用!duplicated():

a <- c(rep("A", 3), rep("B", 3), rep("C",2))

b <- c(1,1,2,4,1,1,2,2)

df <-data.frame(a,b)

duplicated(df)

[1] FALSE TRUE FALSE FALSE FALSE TRUE FALSE TRUE

> df[duplicated(df), ]

a b

2 A 1

6 B 1

8 C 2

> df[!duplicated(df), ]

a b

1 A 1

3 A 2

4 B 4

5 B 1

7 C 2

答復：從R數據幀中刪除重復行

反對回復 2019-06-21

牛魔王的故事

TA貢獻1830條經驗獲得超3個贊

功能distinct()在dplyr包執行任意重復刪除，允許指定重復變量(如本問題)或考慮所有變量。

數據：

dat <- data.frame(a = rep(c(1,2),4), b = rep(LETTERS[1:4],2))

刪除指定列重復的行：

library(dplyr)dat %>% distinct(a, .keep_all = TRUE)

  a b1 1 A2 2 B

刪除與其他行完全重復的行：

dat %>% distinct

  a b1 1 A2 2 B3 1 C4 2 D

反對回復 2019-06-21

3 回答
0 關注
756 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

刪除重復行

刪除重復行

3 回答

添加回答