亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

根據另一列是否包含每一行名稱創建新列

根據另一列是否包含每一行名稱創建新列

浮云間 2023-06-20 14:10:35
嘗試使用 pandas 遍歷每一行,評估該行的 B 列值是否包含 A 列中的任何值,然后填充與 A 行中的每個值對應的新列 C、D、E ...。代碼下面是我為獲得相同結果而必須做的事情,但在這里我需要事先知道 A 行中可能存在哪些值。d = {'country': ["USA", "China", "Singapore"], 'allies': ["Turkey, UK, France, India", "DPRK, Singapore", "USA, China"]}df = pd.DataFrame(data=d)df["USAally"] = df['allies'].map(lambda x: 1 if "USA" in x else 0)df["Chinaally"] = df['allies'].map(lambda x: 1 if "China" in x else 0)df["Singaporeally"] = df['allies'].map(lambda x: 1 if "Singapore" in x else 0)

3 回答

?
大話西游666

TA貢獻1817條經驗 獲得超14個贊

您可以使用get_dummies此處有效地執行此操作:


dummies = (df['allies'].str.get_dummies(sep=', ')

                       .reindex(df['country'].unique(), axis=1)

                       .add_suffix('_ally'))

df.join(dummies)                                             


     country                     allies  USA_ally  China_ally  Singapore_ally

0        USA  Turkey, UK, France, India         0           0               0

1      China            DPRK, Singapore         0           0               1

2  Singapore                 USA, China         1           1               0

在哪里,


dummies


   USA_ally  China_ally  Singapore_ally

0         0           0               0

1         0           0               1

2         1           1               0


查看完整回答
反對 回復 2023-06-20
?
慕姐8265434

TA貢獻1813條經驗 獲得超2個贊

讓我們試試這個,用它series.unique來識別獨特的國家,然后str.contains檢查它是否存在。


for c in df.country.unique():

    df[f'{c}_Aally'] = df.allies.str.contains(c).astype(int)

    

df

Out[20]: 

     country                     allies  USA_Aally  China_Aally  Singapore_Aally

0        USA  Turkey, UK, France, India         0           0               0

1      China            DPRK, Singapore         0           0               1

2  Singapore                 USA, China         1           1               0


查看完整回答
反對 回復 2023-06-20
?
慕沐林林

TA貢獻2016條經驗 獲得超9個贊

這是您的代碼的概括,首先獲取列中出現的所有唯一字母letter,然后分別循環遍歷它們并基本上對每個字母執行您在上面所做的事情。


complete_letter_set = set(''.join(df['letter'])

for l in complete_letter_set:

    df[f"letter{l}exists"] = df['letter'].map(lambda x: int(l in x))

請注意,我已將條件簡化1 if A in x else 0為 just int(l in x),因為int(True) == 1無論如何int(False) == 0。


查看完整回答
反對 回復 2023-06-20
  • 3 回答
  • 0 關注
  • 221 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號