亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

共享公共元素的鏈接列表

共享公共元素的鏈接列表

搖曳的薔薇 2023-06-20 14:30:42
我有一個包含成員的組列表,而不是合并共享成員的組我需要保留分組并根據哪些組具有共同成員創建一組新的邊,并根據組的屬性有條件地這樣做源數據如下所示:+----------+------------+-----------+| Group ID | Group Type | Member ID |+----------+------------+-----------+| A? ? ? ? | Type 1? ? ?|? ? ? ? ?1 || A? ? ? ? | Type 1? ? ?|? ? ? ? ?2 || B? ? ? ? | Type 1? ? ?|? ? ? ? ?2 || B? ? ? ? | Type 1? ? ?|? ? ? ? ?3 || C? ? ? ? | Type 1? ? ?|? ? ? ? ?3 || C? ? ? ? | Type 1? ? ?|? ? ? ? ?4 || D? ? ? ? | Type 2? ? ?|? ? ? ? ?4 || D? ? ? ? | Type 2? ? ?|? ? ? ? ?5 |+----------+------------+-----------+期望的輸出是這樣的:+----------+-----------------+| Group ID | Linked Group ID |+----------+-----------------+| A? ? ? ? | B? ? ? ? ? ? ? ?|| B? ? ? ? | C? ? ? ? ? ? ? ?|+----------+-----------------+A 鏈接到 B 因為它共享 2 B 鏈接到 C 因為它共享 3 C 不鏈接到 D,它有一個共同的成員但屬于不同類型共享成員的數量對我來說并不重要,一個共同的成員意味著他們是鏈接的輸出被用作圖的邊,所以如果輸出是符合規則的圖,那很好源數據集很大(數億行),因此性能是一個考慮因素這提出了一個類似的問題,但是我是 Python 的新手,無法弄清楚如何將源數據獲取到可以使用答案的地步,或者在組類型匹配的附加要求中工作
查看完整描述

1 回答

?
慕姐4208626

TA貢獻1852條經驗 獲得超7個贊

嘗試這樣的事情-

df1=df.groupby(['Group Type','Member ID'])['Group ID'].apply(','.join).reset_index()
df2=df1[df1['Group ID'].str.contains(",")]

這可能無法處理循環分組的情況。


查看完整回答
反對 回復 2023-06-20
  • 1 回答
  • 0 關注
  • 121 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號