已解決430363個問題，去搜搜看，總會有你想問的

共享公共元素的鏈接列表

首頁猿問共享公共元素的鏈接列表

共享公共元素的鏈接列表

Python

搖曳的薔薇 2023-06-20 14:30:42

我有一個包含成員的組列表，而不是合并共享成員的組我需要保留分組并根據哪些組具有共同成員創建一組新的邊，并根據組的屬性有條件地這樣做源數據如下所示：+----------+------------+-----------+| Group ID | Group Type | Member ID |+----------+------------+-----------+| A? ? ? ? | Type 1? ? ?|? ? ? ? ?1 || A? ? ? ? | Type 1? ? ?|? ? ? ? ?2 || B? ? ? ? | Type 1? ? ?|? ? ? ? ?2 || B? ? ? ? | Type 1? ? ?|? ? ? ? ?3 || C? ? ? ? | Type 1? ? ?|? ? ? ? ?3 || C? ? ? ? | Type 1? ? ?|? ? ? ? ?4 || D? ? ? ? | Type 2? ? ?|? ? ? ? ?4 || D? ? ? ? | Type 2? ? ?|? ? ? ? ?5 |+----------+------------+-----------+期望的輸出是這樣的：+----------+-----------------+| Group ID | Linked Group ID |+----------+-----------------+| A? ? ? ? | B? ? ? ? ? ? ? ?|| B? ? ? ? | C? ? ? ? ? ? ? ?|+----------+-----------------+A 鏈接到 B 因為它共享 2 B 鏈接到 C 因為它共享 3 C 不鏈接到 D，它有一個共同的成員但屬于不同類型共享成員的數量對我來說并不重要，一個共同的成員意味著他們是鏈接的輸出被用作圖的邊，所以如果輸出是符合規則的圖，那很好源數據集很大（數億行），因此性能是一個考慮因素這提出了一個類似的問題，但是我是 Python 的新手，無法弄清楚如何將源數據獲取到可以使用答案的地步，或者在組類型匹配的附加要求中工作

查看完整描述

1 回答

慕姐4208626

TA貢獻1852條經驗獲得超7個贊

嘗試這樣的事情-

df1=df.groupby(['Group Type','Member ID'])['Group ID'].apply(','.join).reset_index()
df2=df1[df1['Group ID'].str.contains(",")]

這可能無法處理循環分組的情況。

反對回復 2023-06-20

1 回答
0 關注
136 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

共享公共元素的鏈接列表

共享公共元素的鏈接列表

1 回答

添加回答