亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

<small id="xlrir"><button id="xlrir"></button></small>

<dfn id="xlrir"><code id="xlrir"><small id="xlrir"></small></code></dfn>

我的購物車

已加入門課程

購物車里空空如也

快去這里選購你中意的課程

我的訂單中心

全部開發者教程

Pandas 入門教程

Pandas 簡介與安裝

Pandas 簡介 Pandas 安裝

Pandas 讀取數據

Pandas 讀取數據 Pandas 讀取 MySql 數據 Pandas 數據結構 Series Pandas 數據結構 DataFrame

Pandas 操作數據

Pandas 查詢數據 Pandas 新增數據 Pandas 刪除數據 Pandas 修改數據 Pandas 缺失值的處理 Pandas 重復值的處理 Pandas 的算術運算 Pandas 數據的連接拼合 Pandas 排序和排名操作 Pandas 字符串操作 Pandas 層次化索引 Pandas 數據重塑

Pandas 分組聚合與時間序列

Pandas 分組聚合操作 Pandas 統計描述操作 Pandas 時間序列概述 Pandas 時間序列之 Timestamp Pandas 時間序列之 Period Pandas 時間序列之 Timedelta Pandas 時間序列相關總結

首頁慕課教程 Pandas 入門教程 Pandas 分組聚合操作

松思園 · 更新于 2021-03-12

上一節

Pandas 數據重塑

Pandas 統計描述操作

下一節

Pandas 分組聚合操作

1. 前言

上一節我們學習了 Pandas 對數據的重塑操作，可以滿足我們對數據集不同結構的分析需要，而有時候我們還需要對數據依據某個類別進行分組的需要，以及在分組后對每組數據進行分析的需要，那 Pandas 中的數據分組操作又是怎么實現的呢？

Pandas 庫中提供了友好的數據分組聚合操作，分組聚合的過程包括數據的拆分、應用和聚合，如下圖所示的過程。數據的分組操作主要涉及函數 groupby ()，而聚合函數則有很多，在下面的學習中我們會列舉一些聚合函數的具體使用方法。

圖片描述

2. 分組操作

Pandas 中的分組操作主要通過函數 groupby () 實現，該函數對數據進行分組，并不會產生運算，分組后會返回一個 groupby 對象，該對象并不能展示數據，要通過具體的操作函數才能看到數據結果。

首先我們通過 Pandas 解析 Excel 數據，得到 DataFrame 數據對象：

# 導入pandas包
import pandas as pd
data_path="C:/Users/13965/Documents/myFuture/IMOOC/pandasCourse-progress/data_source/第19小節/execl數據demo.xlsx"
# 解析數據
data = pd.read_excel(data_path)
print(data)

# --- 輸出結果 ---
   編程語言 技術方向   推出時間  年均銷售數量    價格      主要創始人
0  java   后端       1995年     230       45.6               James Gosling
1  HTML   前端       1990年     124       55.3          Daniel W. Connolly
2     C   后端       1972年      35       33.9  Dennis MacAlistair Ritchie
3    js   前端       1995年     678       59.5                Brendan Eich
4   C++   后端       1983年     125       75.0           Bjarne Stroustrup
5   CSS   前端       1990年     254       24.6             Tim Berners-Lee

接下來我們進行分組操作：

# data 為上面解析的數據對象
# 這里依據技術方向列進行分組
data.groupby('技術方向')
# --- 輸出結果 ---
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001D618583070>
# 結果解析：這里我們使用的是單個索引‘技術方向’進行分組，也可以傳入一個列表進行分組。這里可以看到輸出的是一個 DataFrameGroupBy 對象

3. 聚合操作

聚合操作是分組的目的，通過聚合操作對各組數據進行聚合，得到一定的分析效果，Pandas 中提供了大量的聚合操作函數，我們下面列舉了部分，用以展示數據分組后進行聚合操作的效果。

函數名	說明
count	各分組中非 NaN 值的數量
sum	各分組中非 NaN 值的和
mean	各分組中非 NaN 值的平均值

下面我們通過代碼詳細介紹聚合函數的使用：

1. sum() 函數

該函數用于求各組數值數據的和，非數值數據不進行該聚合操作。

data.groupby(['技術方向','推出時間']).sum()
# --- 輸出結果 ---
                 年均銷售數量	價格
技術方向	推出時間		
  前端	 1990年	378	   79.9
          1995年	 678	59.5
  后端	 1972年	35	   33.9
          1983年	 125	75.0
          1995年	 230	45.6
# 結果解析：這里我們指定分組索引依據為列表，傳入‘技術方向’，‘推出時間’，則分組是先以技術方向分為“前端”和“后端”，再以推出時間進行分組，帶分組之后，進行 sum() 各組求和的聚合運算，得到各組的年均銷售數量和價格的數據結果。

在這里我們要補充一個下 groupby () 函數中的一個參數：as_index ，該參數默認為 True，是用來指定是否用分組索引作為聚合結果數據集的行索引，上面的代碼中，默認 as_index=True ，因此行索引會有兩層，分別為技術方向和推出時間，下面我們通過指定 as_index=False , 默認行索引會從 0 開始生成序列：

# data 為上面解析的數據對象
# 指定 as_index=False
data.groupby(['技術方向','推出時間'],as_index=False).sum()
# --- 輸出結果 ---
  技術方向	推出時間 年均銷售數量	價格
0	前端	1990年	   378	   79.9
1	前端	1995年	   678	   59.5
2	后端	1972年	   35	   33.9
3	后端	1983年	   125	   75.0
4	后端	1995年	   230	   45.6
# 結果解析：可以看到聚合后的數據集行索引為默認生成。

2. count() 函數

該函數用于計算分組后各組數據的數量。

# data 為上面解析的數據對象
# count() 函數
data.groupby(['技術方向','推出時間'],as_index=False)['編程語言','年均銷售數量','價格'].count()
# --- 輸出結果 ---
   技術方向	推出時間  編程語言 年均銷售數量 價格
0	前端	  1990年	    2	    2	    2
1	前端	  1995年	    1	    1	    1
2	后端	  1972年	    1	    1	    1
3	后端	  1983年	    1	    1	    1
4	后端	  1995年	    1	    1	    1

結果解析：這里我們通過 count () 進行聚合，并指定只聚合 “編程語言”，“年均銷售數量”，“價格” 列的數據數量。

3. mean() 函數

該函數用于進行各分組數據的平均值的計算，該函數只對數值數據進行聚合。

# data 為上面解析的數據對象
# mean() 函數
data.groupby(['技術方向'],as_index=False).mean()
# --- 輸出結果 ---
  技術方向	年均銷售數量	價格
0	前端	    352	    46.466667
1	后端	    130	    51.500000

結果解析：通過 groupby 指定以技術方向進行分組，分為前端和后端，然后進行平均值的聚合操作。

4. 小結

本節課程我們主要學習了 Pandas 對數據進行分組和聚合操作的內容，通過分組操作可以將數據根據不同的組類進行分組，通過聚合函數可以達到對每組數據的不同分析需要。本節課程的重點如下：

了解分組和聚合之間的關系；
掌握分組操作 groupby () 函數的使用方法；
掌握常用的聚合操作函數的使用方法。

圖片描述

上一節

Pandas 數據重塑

下一節

Pandas 統計描述操作

我要提出意見反饋

索引目錄

Pandas 分組聚合操作

2. 分組操作

3. 聚合操作

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

掃描二維碼
關注慕課網微信公眾號

<span id="nl0du"><i id="nl0du"><kbd id="nl0du"></kbd></i></span>