如何使用不同列 [2] 中的字符串值列表替換數據框列 [1] 中的字符串值。數據 0 1 2 30 3000 20% dummy1 3000 dummy2 20% [3000, 20%] dummy1 dummy2我想使用第 2 列中的列表(即“[3000, 20%]”)替換第 1 列中的字符串值,即“dummy1 3000 dummy2 20%”。所以 3000 和 20% 被替換為字符串中的“”(空字符串)以形成第三列(結果)即“dummy1 dummy2”代碼df = pd.DataFrame([['3000 20%', 'dummy1 3000 dummy2 20%']])df[2] = df[0].str.split(' ')def replace_string(x): repl_string = str(x[1]) for key in x[2]: repl_string = repl_string.replace(key, '') return ' '.join(repl_string.split())df[3] = df.apply(replace_string, axis=1)我目前已經編寫了上面的代碼,這對于大型數據幀來說很慢。如何提高此代碼的效率或有其他方法可以做到這一點?
1 回答

素胚勾勒不出你
TA貢獻1827條經驗 獲得超9個贊
使用嵌套列表理解:
df = pd.DataFrame([['3000 20%', 'dummy1 a 3000 dummy2 20%'],
['abc 2%', 'klmn 3000 dummy2 2%']])
print (df)
0 1
0 3000 20% dummy1 a 3000 dummy2 20%
1 abc 2% klmn 3000 dummy2 2%
df[3] = [' '.join(y for y in j.split() if y not in i.split()) for i, j in zip(df[0], df[1])]
print (df)
0 1 3
0 3000 20% dummy1 a 3000 dummy2 20% dummy1 a dummy2
1 abc 2% klmn 3000 dummy2 2% klmn 3000 dummy2
添加回答
舉報
0/150
提交
取消