我需要幫助轉換數據,如下所示:來自此版本中的數據集 (df1) ID apples oranges pears apples_pears oranges_pears0 1 1 0 0 1 01 2 0 1 0 1 02 3 0 1 1 0 1到如下數據集(df2): ID apples oranges pears0 1 2 0 11 2 1 1 12 3 0 2 2我想要完成的是從列名稱中出現“蘋果”一詞的所有列中獲取蘋果的總價值。例如,在 df1 中有 2 個列名稱,其中出現單詞“apple”。如果將第一行中的所有蘋果相加,則總共有 2 個。我想要新數據集 (df2) 中的蘋果有一列。請注意,appleas_pears 的 1 是每個蘋果和梨的 1。
1 回答

紫衣仙女
TA貢獻1839條經驗 獲得超15個贊
想法被分成DataFrame
新的2 - 首先通過之前的所有值更改列名稱,然后使用by和_
第二個過濾器列通過之后的值更改列,最后通過和每列的總和連接在一起:_
DataFrame.filter
_
concat
df1 = df.set_index('ID')
df2 = df1.filter(like='_')
df1.columns = df1.columns.str.split('_').str[0]
df2.columns = df2.columns.str.split('_').str[1]
df = pd.concat([df1, df2], axis=1).sum(level=0, axis=1).reset_index()
print (df)
? ?ID? apples? oranges? pears
0? ?1? ? ? ?2? ? ? ? 0? ? ? 1
1? ?2? ? ? ?1? ? ? ? 1? ? ? 1
2? ?3? ? ? ?0? ? ? ? 2? ? ? 2
添加回答
舉報
0/150
提交
取消