亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何遍歷唯一 ID 并計算日期值之間的差異并將值寫入新列

如何遍歷唯一 ID 并計算日期值之間的差異并將值寫入新列

Cats萌萌 2022-06-22 18:14:16
我有一個帶有唯一 ID、階段和與該階段關聯的日期的 pandas 數據框。我想創建一個新列,顯示在該特定階段花費的時間。這意味著減去該唯一 ID 的日期減去與該相同 ID 關聯的下一階段的日期。由于數據是按 ID 和階段排序的,該 ID 記錄的最后階段應該出錯并讀取“當前”或 n/a。它有助于查看下面的數據。我在想有一種方法可以執行多個 for 循環,但我不確定如何執行此操作。我曾嘗試在融合數據框之前創建新列,但在很多情況下下一階段是 n/a。它并不總是第 1 階段=>2=>3 等,它可以直接從第 1 階段跳到第 3 階段。   example.describe   Opportunity_ID  stage      value   0061R00000l43xP    1.0 2018-11-07   0061R00000lUT5r    1.0 2019-05-02   0061R00000lUT5r    2.0 2019-05-22   0061R00000lUT5r    3.0 2019-06-03   80061R0000lUT5r    5.0 2019-06-20   0061R00000lUT5r    5.5 2019-09-10   0061R00000lXwZL    1.0 2018-12-05   0061R00000lXwZL    4.0 2019-04-09   0061R00000lXwZL    5.0 2019-04-19   0061R00000lXwZL    5.5 2019-04-19   0061R00000lXwZL    8.0 2019-05-03   0061R00000lXwZL    9.0 2019-07-09   0061R00000lXwZL   11.0 2019-08-02   0061R00000lY4Vm    1.0 2018-12-06   0061R00000lY4Vm    2.0 2019-09-26   0061R00000lrOGm    3.0 2019-02-15   0061R00000lrOGm    4.0 2019-09-18  [793 rows x 3 columns]>  example.dtypes  Opportunity_ID            object  stage                    float64  value             datetime64[ns]  dtype: object
查看完整描述

1 回答

?
元芳怎么了

TA貢獻1798條經驗 獲得超7個贊

您可以使用sort_values+ groupby 根據 ID 按組計算差異。為了計算差值,使用 . 將日期轉換為日期時間pd.to_datetime:


df['value']=pd.to_datetime(df['value'])

df=df.sort_values(['Opportunity_ID','stage'])

df['difference']=df.groupby('Opportunity_ID')['value'].diff(-1)

print(df)

     Opportunity_ID  stage      value difference

0   0061R00000l43xP    1.0 2018-11-07        NaT

1   0061R00000lUT5r    1.0 2019-05-02   -20 days

2   0061R00000lUT5r    2.0 2019-05-22   -12 days

3   0061R00000lUT5r    3.0 2019-06-03   -99 days

5   0061R00000lUT5r    5.5 2019-09-10        NaT

6   0061R00000lXwZL    1.0 2018-12-05  -125 days

7   0061R00000lXwZL    4.0 2019-04-09   -10 days

8   0061R00000lXwZL    5.0 2019-04-19     0 days

9   0061R00000lXwZL    5.5 2019-04-19   -14 days

10  0061R00000lXwZL    8.0 2019-05-03   -67 days

11  0061R00000lXwZL    9.0 2019-07-09   -24 days

12  0061R00000lXwZL   11.0 2019-08-02        NaT

13  0061R00000lY4Vm    1.0 2018-12-06  -294 days

14  0061R00000lY4Vm    2.0 2019-09-26        NaT

15  0061R00000lrOGm    3.0 2019-02-15  -215 days

16  0061R00000lrOGm    4.0 2019-09-18        NaT

4   80061R0000lUT5r    5.0 2019-06-20        NaT

訂購可能對您不方便。您可以在不預先排序值的情況下計算它。這將是您示例的結果:


df['value']=pd.to_datetime(df['value'])

df['difference']=df.groupby('Opportunity_ID')['value'].diff(-1)

print(df)


    Opportunity_ID  stage      value difference

0   0061R00000l43xP    1.0 2018-11-07        NaT

1   0061R00000lUT5r    1.0 2019-05-02   -20 days

2   0061R00000lUT5r    2.0 2019-05-22   -12 days

3   0061R00000lUT5r    3.0 2019-06-03   -99 days

4   80061R0000lUT5r    5.0 2019-06-20        NaT

5   0061R00000lUT5r    5.5 2019-09-10        NaT

6   0061R00000lXwZL    1.0 2018-12-05  -125 days

7   0061R00000lXwZL    4.0 2019-04-09   -10 days

8   0061R00000lXwZL    5.0 2019-04-19     0 days

9   0061R00000lXwZL    5.5 2019-04-19   -14 days

10  0061R00000lXwZL    8.0 2019-05-03   -67 days

11  0061R00000lXwZL    9.0 2019-07-09   -24 days

12  0061R00000lXwZL   11.0 2019-08-02        NaT

13  0061R00000lY4Vm    1.0 2018-12-06  -294 days

14  0061R00000lY4Vm    2.0 2019-09-26        NaT

15  0061R00000lrOGm    3.0 2019-02-15  -215 days

16  0061R00000lrOGm    4.0 2019-09-18        NaT



查看完整回答
反對 回復 2022-06-22
  • 1 回答
  • 0 關注
  • 132 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號