亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

為共享公共值的每一行合并 Dataframe 中列的內容

為共享公共值的每一行合并 Dataframe 中列的內容

縹緲止盈 2023-06-20 13:32:37
我在分配給不同個人的表中有數據。但是,很多數據基于 MD5 是相同的,我希望每個條目都歸因于具有相同 MD5 的每個人。例如,輸入數據可能如下所示:但是,我希望輸出如下表所示。例如,A、C、E 的所有者相同,因為它們的 MD5 相同(欣賞 MD5 會更長,這只是為了說明)。類似地,對于 B、D、F,MD5 相同,因此 Owner 也被合并為所有 3 個條目。我寫了一個有效的腳本(但效率非常低):md5OwnerDF = pd.DataFrame({"MD5 Digest":[],"All_Owners":[]})for md5 in uniqueTLMD5List:        # sub dataframe with md5        md5DF = df.loc[df['MD5 Digest'] == md5].copy()        # bring in owners of this sub dataframe (md5DF) and convert into unique list (ownerList)        ownerList = ';'.join([str(elem) for elem in md5DF.loc[:,'Owner'].unique().tolist()])        md5OwnerDF_temp = pd.DataFrame({"MD5 Digest":[md5],"All_Owners":[ownerList]})        md5OwnerDF = md5OwnerDF.append(md5CustodianDF_temp)有沒有更好的方法可以在不迭代的情況下獲得相同的結果?
查看完整描述

1 回答

?
有只小跳蛙

TA貢獻1824條經驗 獲得超8個贊

你可以試試transform+groupby

df['new'] = df.roupby('ID')['MD5'].transform(','.join)


查看完整回答
反對 回復 2023-06-20
  • 1 回答
  • 0 關注
  • 132 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號