已解決430363個問題，去搜搜看，總會有你想問的

根據前兩個字母替換 pandas 數據框列的部分內容

首頁猿問根據前兩個字母替換 pandas...

根據前兩個字母替換 pandas 數據框列的部分內容

Python

慕尼黑5688855 2023-06-27 16:46:20

我有一個 pandas 數據框，我需要根據前兩個字母有條件地更新值。該模式很簡單，下面的代碼也可以工作，但感覺不像Python。我需要將其擴展到其他字母（至少 11-19/AJ），雖然我可以添加額外的行，但我真的很想以正確的方式執行此操作?，F有代碼如下df['REFERENCE_ID'] = df['PRECERT_ID'].astype(str)df.loc[df['REFERENCE_ID'].str.startswith('11'), 'REFERENCE_ID'] = 'A' + df['PRECERT_ID'].str[-7:]df.loc[df['REFERENCE_ID'].str.startswith('12'), 'REFERENCE_ID'] = 'B' + df['PRECERT_ID'].str[-7:]df.loc[df['REFERENCE_ID'].str.startswith('13'), 'REFERENCE_ID'] = 'C' + df['PRECERT_ID'].str[-7:]df.loc[df['REFERENCE_ID'].str.startswith('14'), 'REFERENCE_ID'] = 'D' + df['PRECERT_ID'].str[-7:]df.loc[df['REFERENCE_ID'].str.startswith('15'), 'REFERENCE_ID'] = 'E' + df['PRECERT_ID'].str[-7:]我想我也許可以使用字母列表，比如letters = list(string.ascii_uppercase)但我對數據幀（以及一般的Python）很陌生，并且無法弄清楚獲得相當于以下數據幀的語法letters = list(string.ascii_uppercase)text = '1523456789'first = int(text[:2])text = letters[first-11] + text[-7:]我無法找到解決此問題的方法，但如果有任何幫助或類似問題的鏈接（如果存在），我將不勝感激。謝謝。

查看完整描述

2 回答

慕絲7291255

TA貢獻1859條經驗獲得超6個贊

df['REFERENCE_ID'] = df['PRECERT_ID'].astype(str)

# Save all uppercase english letters in a list

letters = list(string.ascii_uppercase)

# Enumerate over the letters list and start with 11 as the OP wants in this way only.

# All the uppercase english letters and corresponding numbers starting with 11.

for i,l in enumerate(letters, start=11):

df.loc[df['REFERENCE_ID'].str.startswith(str(i)), 'REFERENCE_ID'] = l + df['PRECERT_ID'].str[-7:]

反對回復 2023-06-27

千巷貓影

TA貢獻1829條經驗獲得超7個贊

我會嘗試制作一本字典并用來map加快速度。

要創建查找字典，您可以使用：

lu_dict = dict(zip([str(i) for i in range(11,20)],[chr(i) for i in range(65,74)]))

{'11': 'A',

'12': 'B',

'13': 'C',

'14': 'D',

'15': 'E',

'16': 'F',

'17': 'G',

'18': 'H',

'19': 'I'}

然后你可以使用它.str.slice.map來避免 for 循環。

df = pd.DataFrame(data = {'Reference_ID':['112326345','12223356354','6735435634']})

df.Reference_ID = df.Reference_ID.astype(str)

df.loc[:,'Reference_new'] = df.Reference_ID.str.slice(0,2).map(lu_dict) + df.Reference_ID.str.slice(-7, )

結果是：

Reference_ID Reference_new

0 112326345 A2326345

1 12223356354 B3356354

2 6735435634 NaN

反對回復 2023-06-27

2 回答
0 關注
155 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

根據前兩個字母替換 pandas 數據框列的部分內容

根據前兩個字母替換 pandas 數據框列的部分內容

2 回答

添加回答