已解決430363個問題，去搜搜看，總會有你想問的

自動化比較數據幀的多列并將數據存儲到新列的過程

首頁猿問自動化比較數據幀的多列并將數據存儲...

自動化比較數據幀的多列并將數據存儲到新列的過程

Python

飲歌長嘯 2021-11-16 15:41:38

我有一個作為數據框導入的 excel 文件。數據集如下所示：rule_id reqid1 reqid2 reqid3 reqid453139 0 0 1 051181 1 1 1 050412 0 1 1 050356 0 0 1 050239 0 1 0 150238 1 1 1 050014 1 0 1 1我必須相互比較 reqid 列。這是代碼：c1 = list(map(lambda a,b: a if a == b else 100*a , df.reqid1 , df.reqid2))df['comp1'] = c1c2 = list(map(lambda b,c: b if b == c else 100*b , df.reqid2 , df.reqid3))df['comp2'] = c2c3 = list(map(lambda c,d: c if c == d else 100*c , df.reqid3 , df.reqid4))df['comp3'] = c3comps = ['comp1' , 'comp2' , 'comp3']df[comps] = df[comps].replace({0: np.nan})基本上這段代碼的作用是將 reqid1 與 reqid2 、 reqid2 與 reqid3 等進行比較。如果兩列的值都為 0，則應在新創建的列中更新 0，如果兩列的值都為 1，則應在新創建的列中更新 1。如果第一列有 0 并且下一列有 1 那么， NaN 應該更新，如果第一列有 1 并且第二列有 0 ，那么 100 應該更新。我正在為最后一列使用另一個函數?；旧纤淖饔檬侨绻詈笠涣校ㄔ诒纠袨?reqid4）的值為 1 ，則應在新列中更新 100 ，如果值為 0 ，則應更新 0 。這是代碼：def fun(df , col2): df['last_comp'] = np.where((df.loc[: , col2] == 1) , 100 , 0) return df這是我得到的結果：rule_id reqid1 reqid2 reqid3 reqid4 comp1 comp2 comp3 last_comp53139 0 0 1 0 NaN NaN 100.0 051181 1 1 1 0 1.0 1.0 100.0 050412 0 1 1 0 NaN 1.0 100.0 050356 0 0 1 0 NaN NaN 100.0 050239 0 1 0 1 NaN 100.0 NaN 100.050238 1 1 1 0 1.0 1.0 100.0 050014 1 0 1 1 100.0 NaN 1.0 100.0這段代碼對我有用，但我有大數據集，這只是數據的一部分。我有 100 多列，每次都編寫此代碼對我來說是不可行的。我想自動化將一列與另一列進行比較的過程，但我不知道如何進行。如果你能幫助我，那就太好了。

查看完整描述

1 回答

慕田峪9158850

TA貢獻1794條經驗獲得超7個贊

首先將shifted DataFrame 與進行比較DataFrame.eq，然后使用numpy.select2 個布爾掩碼設置值，調用DataFrame構造函數并最后join到原始值：

m = df.eq(df.shift(-1, axis=1))

arr = np.select([df ==0, m], [np.nan, df], df*100)

#python 3.6+ for rename columns

df2 = pd.DataFrame(arr, index=df.index).rename(columns=lambda x: f'comp{x+1}')

#python bellow

#df2 = pd.DataFrame(arr, index=df.index).rename(columns=lambda x: 'comp{}'.format(x+1))

df3 = df.join(df2).reset_index()

print (df3)

rule_id reqid1 reqid2 reqid3 reqid4 comp1 comp2 comp3 comp4

0 53139 0 0 1 0 NaN NaN 100.0 NaN

1 51181 1 1 1 0 1.0 1.0 100.0 NaN

2 50412 0 1 1 0 NaN 1.0 100.0 NaN

3 50356 0 0 1 0 NaN NaN 100.0 NaN

4 50239 0 1 0 1 NaN 100.0 NaN 100.0

5 50238 1 1 1 0 1.0 1.0 100.0 NaN

6 50014 1 0 1 1 100.0 NaN 1.0 100.0

反對回復 2021-11-16

1 回答
0 關注
200 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

自動化比較數據幀的多列并將數據存儲到新列的過程

自動化比較數據幀的多列并將數據存儲到新列的過程

1 回答

添加回答