我有一個 Pandas 數據框,我想對一列進行分組,同時對一列求平均值并在另一列中找到出現次數最多的值我能夠做到,但我認為有一種簡潔的方法可以做到,而不是 4 行代碼import pandas as pddf = pd.DataFrame({'Country' : ['USA', 'USA', 'Russia','USA', 'Russia', 'Russia'], 'City' : ['New-York', 'New-York', 'Sankt-Petersburg', 'Chicago', 'Moscow', 'Moscow'], 'Flights' : [22, 45, 32, 16, 31, 25]})w=df.groupby('Country').mean().round(decimals=2)x=(df.groupby('Country')['City'].agg(pd.Series.mode))y=x.to_frame()z = pd.concat([w, y], axis=1 ,join='outer')Country Flights CityRussia 29.33 MoscowUSA 27.67 New-York
1 回答

慕森王
TA貢獻1777條經驗 獲得超3個贊
GroupBy.agg與 lambda 函數一起使用,也可以為模式添加Series.iat選擇第一個值,因為mode應該返回更多值:
z = df.groupby('Country').agg({'Flights': lambda x: round(x.mean(), 2),
'City': lambda x: x.mode().iat[0]})
print (z)
Flights City
Country
Russia 29.33 Moscow
USA 27.67 New-York
z = df.groupby('Country', as_index=False).agg({'Flights': lambda x: round(x.mean(),2),
'City': lambda x: x.mode().iat[0]})
print (z)
Country Flights City
0 Russia 29.33 Moscow
1 USA 27.67 New-York
添加回答
舉報
0/150
提交
取消