亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

根據前兩個字母替換 pandas 數據框列的部分內容

根據前兩個字母替換 pandas 數據框列的部分內容

慕尼黑5688855 2023-06-27 16:46:20
我有一個 pandas 數據框,我需要根據前兩個字母有條件地更新值。該模式很簡單,下面的代碼也可以工作,但感覺不像Python。我需要將其擴展到其他字母(至少 11-19/AJ),雖然我可以添加額外的行,但我真的很想以正確的方式執行此操作?,F有代碼如下df['REFERENCE_ID'] = df['PRECERT_ID'].astype(str)df.loc[df['REFERENCE_ID'].str.startswith('11'), 'REFERENCE_ID'] = 'A' + df['PRECERT_ID'].str[-7:]df.loc[df['REFERENCE_ID'].str.startswith('12'), 'REFERENCE_ID'] = 'B' + df['PRECERT_ID'].str[-7:]df.loc[df['REFERENCE_ID'].str.startswith('13'), 'REFERENCE_ID'] = 'C' + df['PRECERT_ID'].str[-7:]df.loc[df['REFERENCE_ID'].str.startswith('14'), 'REFERENCE_ID'] = 'D' + df['PRECERT_ID'].str[-7:]df.loc[df['REFERENCE_ID'].str.startswith('15'), 'REFERENCE_ID'] = 'E' + df['PRECERT_ID'].str[-7:]我想我也許可以使用字母列表,比如letters = list(string.ascii_uppercase)但我對數據幀(以及一般的Python)很陌生,并且無法弄清楚獲得相當于以下數據幀的語法letters = list(string.ascii_uppercase)text = '1523456789'first = int(text[:2])text = letters[first-11] + text[-7:]我無法找到解決此問題的方法,但如果有任何幫助或類似問題的鏈接(如果存在),我將不勝感激。謝謝。
查看完整描述

2 回答

?
慕絲7291255

TA貢獻1859條經驗 獲得超6個贊

df['REFERENCE_ID'] = df['PRECERT_ID'].astype(str)


# Save all uppercase english letters in a list

letters = list(string.ascii_uppercase)


# Enumerate over the letters list and start with 11 as the OP wants in this way only. 

# All the uppercase english letters and corresponding numbers starting with 11. 

for i,l in enumerate(letters, start=11):

    df.loc[df['REFERENCE_ID'].str.startswith(str(i)), 'REFERENCE_ID'] = l + df['PRECERT_ID'].str[-7:]



查看完整回答
反對 回復 2023-06-27
?
千巷貓影

TA貢獻1829條經驗 獲得超7個贊

我會嘗試制作一本字典并用來map加快速度。


要創建查找字典,您可以使用:


lu_dict = dict(zip([str(i) for i in range(11,20)],[chr(i) for i in range(65,74)]))

返回:


{'11': 'A',

 '12': 'B',

 '13': 'C',

 '14': 'D',

 '15': 'E',

 '16': 'F',

 '17': 'G',

 '18': 'H',

 '19': 'I'}

然后你可以使用它.str.slice.map來避免 for 循環。


df = pd.DataFrame(data = {'Reference_ID':['112326345','12223356354','6735435634']})

df.Reference_ID = df.Reference_ID.astype(str)


df.loc[:,'Reference_new'] = df.Reference_ID.str.slice(0,2).map(lu_dict) + df.Reference_ID.str.slice(-7, )

結果是:


  Reference_ID Reference_new

0    112326345      A2326345

1  12223356354      B3356354

2   6735435634           NaN


查看完整回答
反對 回復 2023-06-27
  • 2 回答
  • 0 關注
  • 155 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號