亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

通過 group_id 僅使用特定估計窗口中的觀察值進行循環回歸并將預測添加回 pandas 數據框

通過 group_id 僅使用特定估計窗口中的觀察值進行循環回歸并將預測添加回 pandas 數據框

慕森卡 2022-12-20 14:43:09
我正在嘗試學習如何在 python 3.7 中執行一些我通常在 Stata 中輕松執行的操作。我正在處理這樣的數據框:estimation_window    group_id         y            x   0                       1             3.17         231                       1             4.76         261                       2             4.17         731                       2             8.70         720                       2             11.45        16我想要一個 for 循環來估計 group_id 中每個不同組的線性回歸(y on x),只使用虛擬 estimation_window 等于 1 的觀察值。然后,我想將三列添加回我的初始數據框:一列包含預測值,一列包含每個回歸的 beta(x 系數),一列包含每個回歸的截距。應該為所有觀察值計算這些值,而不僅僅是虛擬 estimation_window 等于 1 的那些值。生成的數據集應如下所示:estimation_window    group_id         y            x        predicted_val    beta_coeff  alpha_coeff0                       1             3.17         23           3.10            0.32         1.43        1                       1             4.76         26           4.00            0.32         1.431                       2             4.17         73           4.10            0.75         0.951                       2             8.70         72           8.50            0.75         0.950                       2             11.45        16           10.30           0.75         0.95我嘗試使用 statsmodels 但無法弄清楚。
查看完整描述

1 回答

?
慕容森

TA貢獻1853條經驗 獲得超18個贊

假設你有你的數據框:


>>> data

   estimation_window  group_id      y     x

0                  0         1   3.17  23.0

1                  1         1   4.76  26.0

2                  1         2   4.17  73.0

3                  1         2   8.70  72.0

4                  0         2  11.45  16.0

然后你可以分組group_id,一個一個做線性回歸,把參數存起來。如果您使用statsmodels的是 ,那么您可以執行以下操作:


for groupid, grp in data.groupby('group_id'):

    print(groupid)

    model = sm.OLS(grp['y'], sm.add_constant(grp['x'])).fit()

    data.loc[data['group_id'].eq(groupid), 'alpha'] = model.params['const']

    data.loc[data['group_id'].eq(groupid), 'beta'] = model.params['x']

然后你可以手動重新計算預測值(只是因為線性模型很簡單):


data['predicted_val'] = data['x'] * data['beta'] + data['alpha']

結果是:


   estimation_window  group_id      y     x      alpha      beta  predicted_val

0                  0         1   3.17  23.0  -9.020000  0.530000       3.170000

1                  1         1   4.76  26.0  -9.020000  0.530000       4.760000

2                  1         2   4.17  73.0  12.926162 -0.089804       6.370451

3                  1         2   8.70  72.0  12.926162 -0.089804       6.460255

4                  0         2  11.45  16.0  12.926162 -0.089804      11.489294


查看完整回答
反對 回復 2022-12-20
  • 1 回答
  • 0 關注
  • 83 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號