1 回答

TA貢獻1853條經驗 獲得超18個贊
假設你有你的數據框:
>>> data
estimation_window group_id y x
0 0 1 3.17 23.0
1 1 1 4.76 26.0
2 1 2 4.17 73.0
3 1 2 8.70 72.0
4 0 2 11.45 16.0
然后你可以分組group_id,一個一個做線性回歸,把參數存起來。如果您使用statsmodels的是 ,那么您可以執行以下操作:
for groupid, grp in data.groupby('group_id'):
print(groupid)
model = sm.OLS(grp['y'], sm.add_constant(grp['x'])).fit()
data.loc[data['group_id'].eq(groupid), 'alpha'] = model.params['const']
data.loc[data['group_id'].eq(groupid), 'beta'] = model.params['x']
然后你可以手動重新計算預測值(只是因為線性模型很簡單):
data['predicted_val'] = data['x'] * data['beta'] + data['alpha']
結果是:
estimation_window group_id y x alpha beta predicted_val
0 0 1 3.17 23.0 -9.020000 0.530000 3.170000
1 1 1 4.76 26.0 -9.020000 0.530000 4.760000
2 1 2 4.17 73.0 12.926162 -0.089804 6.370451
3 1 2 8.70 72.0 12.926162 -0.089804 6.460255
4 0 2 11.45 16.0 12.926162 -0.089804 11.489294
添加回答
舉報