亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

pandas groupby 對象,組合和繪圖

pandas groupby 對象,組合和繪圖

長風秋雁 2023-06-13 17:17:44
我可能不太了解何時或如何使用 pandas.DataFrame 的 groupby 函數。在下面的示例中,我想按花瓣長度對我的數據框進行分箱,并計算條目數、每個分箱的平均值和分布。我可以通過三個 groupby 調用來做到這一點,但隨后我在三個單獨的對象中得到了答案。因此,我之后將它們連接起來。現在我有一個對象,但所有列都稱為萼片寬度,將名稱傳遞給 concat 對我不起作用。我也想得到 bin 和平均值,例如用于繪圖,但我不知道該怎么做。import matplotlib.pyplot as pltimport pandas as pdfrom sklearn import datasetsiris = datasets.load_iris()data = pd.DataFrame(iris.data)data.columns = iris.feature_namesdata["bin"] = pd.cut(data["petal length (cm)"], 5)g0 = data.groupby(["bin"])["sepal width (cm)"].count()g1 = data.groupby(["bin"])["sepal width (cm)"].mean()g2 = data.groupby(["bin"])["sepal width (cm)"].std()# how to get better names?g = pd.concat([g0, g1, g2], axis=1)print g# how to extract bin and mean e.g. for plotting?#plt.plot(g.bin, g.mean)
查看完整描述

1 回答

?
拉風的咖菲貓

TA貢獻1995條經驗 獲得超2個贊

關于問題的第二部分,您可以使用字符串操作。

如果我理解正確,你可以使用這個:


a = data['bin']

a1 = a.astype(str).str.strip('([])').str.split(',').str[0].astype(float) 

a2 = a.astype(str).str.strip('([])').str.split(',').str[1].astype(float)


data['bin_center'] = (a1+a2)/2

g = data.groupby('bin_center')['sepal width (cm)'].agg(['count', 'mean', 'std'])


plt.plot(g.index, g['mean'])

http://img1.sycdn.imooc.com//648834570001734306040523.jpg

順便說一句,如果你不想要 bin 中心,并且你想查看帶有 bins 的圖,
你可以使用 dataframe plot:

g = data.groupby('bin')['sepal width (cm)'].agg(['count', 'mean', 'std'])
print(g)
g['mean'].plot()

http://img1.sycdn.imooc.com//648834670001ebbb05670545.jpg

查看完整回答
反對 回復 2023-06-13
  • 1 回答
  • 0 關注
  • 180 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號