亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

已解決430363個問題，去搜搜看，總會有你想問的

R中考慮兩列的唯一行，無順序

關注

首頁猿問 R中考慮兩列的唯一行，無順序

R中考慮兩列的唯一行，無順序

R語言

HUH函數 2019-10-21 14:56:08

與我發現的問題不同，我想不按順序獲取兩列的唯一性。我有一個df：df<-cbind(c("a","b","c","b"),c("b","d","e","a"))> df [,1] [,2] [1,] "a" "b" [2,] "b" "d" [3,] "c" "e" [4,] "b" "a" 在這種情況下，從ba與ba相同的意義上說，行1和行4是“重復項”。我知道如何找到列1和2的唯一性，但是在這種方法下，我會發現每一行都是唯一的。

查看完整描述

3 回答

www說

TA貢獻1775條經驗獲得超8個贊

有很多方法可以做到這一點，這是一種：

unique(t(apply(df, 1, sort)))

duplicated(t(apply(df, 1, sort)))

一個給出唯一的行，另一個給出掩碼。

1 反對回復 2019-10-21

慕的地8271018

TA貢獻1796條經驗獲得超4個贊

如果只有兩列，則還可以使用pmin和pmax，如下所示：

library(data.table)

unique(as.data.table(df)[, c("V1", "V2") := list(pmin(V1, V2),

pmax(V1, V2))], by = c("V1", "V2"))

# V1 V2

# 1: a b

# 2: b d

# 3: c e

使用“ dplyr”的類似方法可能是：

library(dplyr)

data.frame(df, stringsAsFactors = FALSE) %>%

mutate(key = paste0(pmin(X1, X2), pmax(X1, X2), sep = "")) %>%

distinct(key)

# X1 X2 key

# 1 a b ab

# 2 b d bd

# 3 c e ce

反對回復 2019-10-21

湖上湖

TA貢獻2003條經驗獲得超2個贊

如果所有元素都是字符串（哎呀，即使不是，也可以強迫它們），那么一個技巧就是將其創建為data.frame并在其中使用一些dplyr技巧。

library(dplyr)

df <- data.frame(v1 = c("a","b","c","b"), v2 = c("b","d","e","a"))

df$key <- apply(df, 1, function(s) paste0(sort(s), collapse=''))

head(df)

## v1 v2 key

## 1 a b ab

## 2 b d bd

## 3 c e ce

## 4 b a ab

該$key列現在應該告訴您重復。

df %>% group_by(key) %>% do(head(., n = 1))

## Source: local data frame [3 x 3]

## Groups: key

## v1 v2 key

## 1 a b ab

## 2 b d bd

## 3 c e ce

反對回復 2019-10-21

3 回答
0 關注
780 瀏覽

關注

添加回答

舉報

0/150

提交

取消

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

R中考慮兩列的唯一行，無順序

R中考慮兩列的唯一行，無順序

3 回答

添加回答

R中考慮兩列的唯一行，無順序