dt = {'id': [120,120,120,120,121,121,121], 'day': [0, 1,2,3,0,1,2], 'value': [[0.5,3.4,2.7],[0.45,3.4,0.7],[0.25,0.4,0.7],[0.15,0.34,0.17],[0.35,3.4,2.7],[0.5,3.44,2.57],[0.5,0.34,0.37]]}df = pd.DataFrame(data=dt) day id value0 0 120 [0.5, 3.4, 2.7]1 1 120 [0.45, 3.4, 0.7]2 2 120 [0.25, 0.4, 0.7]3 3 120 [0.15, 0.34, 0.17]4 0 121 [0.35, 3.4, 2.7]5 1 121 [0.5, 3.44, 2.57]6 2 121 [0.5, 0.34, 0.37]我有一個pandas dataframe. 我希望該序列column "day"的最大值為1。對于column day大于1的值,我要刪除其初始行,然后將序列重置為[0-1]這就是在這種情況下,column"id"=120有列“天”有兩個額外的值2和3。我想刪除自己的前兩排在這種情況下,然后更換日的列值(0,1)。結果: day id value0 0 120 [0.25, 0.4, 0.7]1 1 120 [0.15, 0.34, 0.17]2 0 121 [0.5, 3.44, 2.57]3 1 121 [0.5, 0.34, 0.37]
2 回答

烙印99
TA貢獻1829條經驗 獲得超13個贊
您可以減去按id和分組時的最大值query
m = df.groupby('id').day.transform('max')
df.assign(day=df.day.sub(m - 1)).query('day >= 0')
day id value
2 0 120 [0.25, 0.4, 0.7]
3 1 120 [0.15, 0.34, 0.17]
5 0 121 [0.5, 3.44, 2.57]
6 1 121 [0.5, 0.34, 0.37]

三國紛爭
TA貢獻1804條經驗 獲得超7個贊
您可以使用groupbywith tail,然后我們會cumcount重新創建這一天
df.groupby('id').tail(2).assign(day=lambda x : x.groupby('id').cumcount())
Out[221]:
day id value
2 0 120 [0.25, 0.4, 0.7]
3 1 120 [0.15, 0.34, 0.17]
5 0 121 [0.5, 3.44, 2.57]
6 1 121 [0.5, 0.34, 0.37]
添加回答
舉報
0/150
提交
取消