已解決430363個問題，去搜搜看，總會有你想問的

如何使用其他列中有時包含 np.nan 的字符串填充 df 列，通過 elifs 迭代以返回適當

首頁猿問如何使用其他列中有時包含...

如何使用其他列中有時包含 np.nan 的字符串填充 df 列，通過 elifs 迭代以返回適當

Python

慕絲7291255 2023-12-12 21:32:49

具有不完美數據的 df：df = pd.DataFrame({'A Surname' : ['Smith', 'Longshore', 'Jones'], 'A Title': ['Mr', 'Miss', np.nan], 'B Surname' : ['Smith', np.nan, 'Nguyen'], 'B Title': ['Mrs', np.nan, np.nan]})我正在尋找一列，該列包含適合在可能的情況下同時尋址 A 和 B 的字符串。如果有np.nan，則組合字段返回np.nan，并且它需要符合邏輯（例如，如果“B姓氏”是np.nan，則不要使用“B標題”），所以我需要一系列規則來確定最合適的組合。我不成功的做法：def combined(x): full = df['A Title'] + ' ' & df['A Surname'] & ' & ' & df['B Title'] & ' ' & df['B Surname'] no_title = df['A Surname'] & ' & ' & df['B Surname'] # more combinations if full != np.nan: return full elif no_title != np.nan: return no_title # more elifs else: return df['A Surname'] df['combined string'] = np.nandf['combined string'] = df['combined string'].apply(combined)所需的輸出如下所示：desired_df = pd.DataFrame({'A Surname' : ['Smith', 'Longshore', 'Jones'], 'A Title': ['Mr', 'Miss', 'Mr'], 'B Surname' : ['Smith', np.nan, 'Whatever'], 'B Title': ['Mrs', np.nan, np.nan], 'combined string': ['Mr Smith & Mrs Smith', 'Miss Longshore', 'Jones & Whatever']})有什么實際的方法可以做到這一點？

查看完整描述

2 回答

滄海一幻覺

TA貢獻1824條經驗獲得超5個贊

Series.str.cat與這里一起使用Series.str.strip：

a = df['A Title'].str.cat(df['A Surname'], sep=' ', na_rep='').str.strip()

b = df['B Title'].str.cat(df['B Surname'], sep=' ', na_rep='').str.strip()

df['combined string'] = a.str.cat(b, sep=' & ').str.strip(' &')

print (df)

? ?A Surname A Title B Surname B Title? ? ? ?combined string

0? ? ? Smith? ? ? Mr? ? ?Smith? ? ?Mrs? Mr Smith & Mrs Smith

1? Longshore? ? Miss? ? ? ?NaN? ? ?NaN? ? ? ? Miss Longshore

2? ? ? Jones? ? ?NaN? ? Nguyen? ? ?NaN? ? ? ? Jones & Nguyen

反對回復 2023-12-12

qq_遁去的一_1

TA貢獻1725條經驗獲得超8個贊

找到了一個將函數與一起應用的解決方案axis=1，允許引用函數中的其他列。

def combined(x):

if x['B Surname'] == '':

if x['A Title'] == '':

return x['A Surname']

else:

return x['A Title'] + ' ' + x['A Surname']

else:

if (x['A Title'] == '') or (x['B Title'] == ''):

return x['A Surname'] + ' & ' + x['B Surname']

else:

return x['A Title'] + ' ' + x['A Surname'] + ' & ' + x['B Title'] + ' ' + x['B Surname']

df = df.fillna('')

df['combined string'] = df.apply(combined, axis=1)

np.nan 值必須轉換為空字符串，因為我無法弄清楚如何避免將 np.nans 轉換為“nan”字符串或在函數內重新分配列值。

注意df = df.fillna('')適用于整個 df。所有空字符串都可以通過以下方式轉換為 nandf = df.replace(r'^\s*$', np.nan, regex=True)

反對回復 2023-12-12

2 回答
0 關注
194 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

如何使用其他列中有時包含 np.nan 的字符串填充 df 列，通過 elifs 迭代以返回適當

如何使用其他列中有時包含 np.nan 的字符串填充 df 列，通過 elifs 迭代以返回適當

2 回答

添加回答

如何使用其他列中有時包含 np.nan 的字符串填充 df 列，通過 elifs 迭代以返回適當

如何使用其他列中有時包含 np.nan 的字符串填充 df 列，通過 elifs 迭代以返回適當