亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

pandas 數據幀的共現矩陣

pandas 數據幀的共現矩陣

四季花海 2023-06-27 13:28:02
問題我有一個 pandas 數據框,我需要計算數據框中每個唯一條目出現在每個其他條目的同一行中的行數??芍貜偷脑O置import?pandas?as?pd import?numpy?as?np數據框:df = pd.DataFrame({'a': ['A', 'A', 'B', 'B'],? ? ? ? ? ? ? ? ? ?'b': ['B', 'C', 'B', 'B'],? ? ? ? ? ? ? ? ? ?'c': ['C', 'A', 'C', 'A'],? ? ? ? ? ? ? ? ? ?'d': ['B', 'D', 'B', 'A']},? ? ? ? ? ? ? ? ? ?index=[0, 1, 2, 3])IE:+----+-----+-----+-----+-----+|? ? | a? ?| b? ?| c? ?| d? ?||----+-----+-----+-----+-----||? 0 | A? ?| B? ?| C? ?| B? ?||? 1 | A? ?| C? ?| A? ?| D? ?||? 2 | B? ?| B? ?| C? ?| B? ?||? 3 | B? ?| B? ?| A? ?| A? ?|+----+-----+-----+-----+-----+我嘗試過的我嘗試使用answer 中的代碼,& 替換這些變量:document = [list(each) for each in df.values]names = list(np.unique(df.values))它給出了錯誤的結果:? A B C DA 4 6 3 2B 6 10 5 0C 3 5 0 1D 2 0 1 0它是基于迭代的,所以我希望有更好的解決方案。預期輸出+----+-----+-----+-----+-----+|? ? |? ?A |? ?B |? ?C |? ?D ||----+-----+-----+-----+-----|| A? | nan |? ?2 |? ?2 |? ?1 || B? |? ?2 | nan |? ?2 |? ?0 || C? |? ?2 |? ?2 | nan |? ?1 || D? |? ?1 |? ?0 |? ?1 | nan |+----+-----+-----+-----+-----+有些2行同時出現A& B,因此單元格A行列中的B值為2。有些2行同時出現A& C,因此單元格A行列中的C值為2。問題如何在 Pandas 中輕松獲得行共現矩陣?如果我不必循環遍歷這些值,那就太好了。
查看完整描述

1 回答

?
守著星空守著你

TA貢獻1799條經驗 獲得超8個贊

我們可以做stack然后get_dummies有價值dot


s=df.stack().str.get_dummies().sum(level=0).ne(0).astype(int)

s=s.T.dot(s).astype(float)

np.fill_diagonal(s.values, np.nan)

s

Out[33]: 

     A    B    C    D

A  NaN  2.0  2.0  1.0

B  2.0  NaN  2.0  0.0

C  2.0  2.0  NaN  1.0

D  1.0  0.0  1.0  NaN


查看完整回答
反對 回復 2023-06-27
  • 1 回答
  • 0 關注
  • 111 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號