已解決430363個問題，去搜搜看，總會有你想問的

如何在相似的行名上使用 Pandas 識別模式

首頁猿問如何在相似的行名上使用...

如何在相似的行名上使用 Pandas 識別模式

Python

aluckdog 2022-09-06 19:42:38

我正在導入一個具有類似供應商名稱的excel文件，并使用agg函數添加支出，然后使用排序函數對支出進行排序。最終，這些數據幀被饋送到動態散景圖上。由于文本格式，我的供應商名稱差異很大，我的pandas數據幀在添加支出時無法識別此模式。盡管它是同一個供應商，但我沒有得到支出的整體視圖，但缺少一些數據，最終沒有在散景圖中得到計數。數據Vendor Site SpendABC INC A 300ABC,Inc B 100ABC,Inc. C 50ABC,INC. D 10預期成果所有數據加起來應為 460。

查看完整描述

1 回答

犯罪嫌疑人X

TA貢獻2080條經驗獲得超4個贊

在嘗試獲取總和之前，您可以處理標點符號，空格和大寫字母與更低的值，但它會更改輸出中供應商的名稱：

df.groupby([x.upper().replace(' ', '').replace(',','').replace('.','') for x in df['Vendor']])['Spend'].sum()

ABCINC 460

您還可以在調用組之前就地修改列名：

df['Vendor'] = df['Vendor'].str.upper().str.replace(' ', '').str.replace(',','').str.replace('.','')

print(df.groupby('Vendor')['Spend'].sum())

df 現在如下所示：

Vendor Site Spend

0 ABCINC A 300

1 ABCINC B 100

2 ABCINC C 50

3 ABCINC D 10

和輸出：

ABCINC 460

反對回復 2022-09-06

1 回答
0 關注
95 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

如何在相似的行名上使用 Pandas 識別模式

如何在相似的行名上使用 Pandas 識別模式

1 回答

添加回答