我有一個數據框,我想將其總結為一個新的數據框:原始數據框有一個人、一個日期和三個虛擬類別——足球、網球和排球,表明一個人在該日期參加了該運動(灰色表格)我想制作一個“摘要 df”,顯示該人每季度參加每項運動的次數(藍色表格)。當數據框由 100 多個不同的人和幾十萬個日期組成時,有什么方法可以真正有效地做到這一點?我有點不知所措,感謝任何答案!
1 回答

鳳凰求蠱
TA貢獻1825條經驗 獲得超4個贊
一個想法是先將日期時間轉換為季度和年份,Series.dt.quarter
然后Series.dt.year
再聚合sum
:
dates = pd.to_datetime(df['Date'], format='%d.%m.%Y')df1 = (df.groupby(['Person', dates.dt.quarter.rename('Quarter'), dates.dt.year.rename('Year')], sort=False) .sum() .reset_index())
添加回答
舉報
0/150
提交
取消