亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

重新定義銷售數據庫中的索引列

重新定義銷售數據庫中的索引列

胡子哥哥 2023-06-27 16:45:11
我一直在清理這個銷售數據庫,其中的數據是從多個來源收集的,賬單編號很混亂,但它們是唯一將多個訂單引用到同一張賬單的列,但隨著時間的推移使用不同的系統會導致賬單編號重復。要解決此問題,我需要為日期不同的帳單編號單元格提供一個新編號,例如,如果我有一張帳單編號為 1,日期為 2019 年,而另一張帳單的帳單編號相同,但在 2018 年,我需要給它一個不同的賬單號碼。df 的樣本:       bill_no  item_ser                date                  item size   price0         1       111 2018-12-15 15:09:50          Rockla Salad    R   39.001         1       111 2018-12-15 15:09:50          Rockla Salad    R   39.002         1       112 2018-12-15 15:10:16                   Tea    R    8.003         1       112 2018-12-15 15:10:16                   Tea    R    8.004         1       309 2019-02-21 10:02:24            Eggs Toast    R   35.005         1       309 2019-02-21 10:02:24            Eggs Toast    R   35.006         1         1 2020-07-20 12:38:16      Nody's Sfilatino    R   99.757         1         1 2020-07-20 12:38:16      Nody's Sfilatino    R   99.758         1      2715 2020-05-06 01:13:41  Basilico Buffalo - R    R  110.009         1      2715 2020-05-06 01:13:41  Basilico Buffalo - R    R  110.0010        1      2716 2020-05-06 01:13:41   Timmy's Merguez - R    R  130.0011        1      2716 2020-05-06 01:13:41   Timmy's Merguez - R    R  130.0012        1      2717 2020-05-06 01:13:41            Funghi - R    R  105.0013        1      2717 2020-05-06 01:13:41            Funghi - R    R  105.0014        1      2718 2020-05-06 01:13:41          Extra Cheese    R   20.0015        1      2718 2020-05-06 01:13:41          Extra Cheese    R   20.0016        1         8 2020-07-05 16:27:37        Margherita - R    R   65.0017        1         8 2020-07-05 16:27:37        Margherita - R    R   65.0018        1         9 2020-07-05 16:27:39      Extra Vegetables    R   10.0019        1         9 2020-07-05 16:27:39      Extra Vegetables    R   10.00我嘗試過 for 循環,但有 150K 行,這需要很多時間。
查看完整描述

1 回答

?
肥皂起泡泡

TA貢獻1829條經驗 獲得超6個贊

# Get new_bill_no on the basis of [bill_no, date]

df1 = df[['bill_no', 'date']].drop_duplicates().reset_index()

df1.rename({'index': 'new_bill_no'}, axis=1, inplace=True)


# On Merging you will get new_bill_no in original df

df = df.merge(df1, on=['bill_no', 'date'], how='left'])


查看完整回答
反對 回復 2023-06-27
  • 1 回答
  • 0 關注
  • 127 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號