我有一個數據框,我想將其總結為一個新的數據框:原始數據框有一個人、一個日期和三個虛擬類別——足球、網球和排球,表明一個人在該日期參加了該運動(灰色表格)我想制作一個“摘要 df”,顯示該人每季度參加每項運動的次數(藍色表格)。當數據框由 100 多個不同的人和幾十萬個日期組成時,有什么方法可以真正有效地做到這一點?我有點不知所措,感謝任何答案!
1 回答
鳳凰求蠱
TA貢獻1825條經驗 獲得超4個贊
一個想法是先將日期時間轉換為季度和年份,Series.dt.quarter然后Series.dt.year再聚合sum:
dates = pd.to_datetime(df['Date'], format='%d.%m.%Y')df1 = (df.groupby(['Person',
dates.dt.quarter.rename('Quarter'),
dates.dt.year.rename('Year')], sort=False)
.sum()
.reset_index())添加回答
舉報
0/150
提交
取消
