SQL Group By & Having
1. 定義
慕課解釋:
Group By
用于數據分組,一般與聚合函數一起使用,對分組后的數據進行聚合操作。由于 Where 無法與聚合函數一起搭配使用,因此 SQL 增加Having
指令。
2. 前言
本小節,我們將一起學習Group By
和Having
。
SQL 不僅提供數據操作功能相關的指令,而且也提供了一些指令進行數據統計和分析。如,Group By 提供了分組功能對數據分門別類,Having 可以與聚合函數搭配用于篩選數據。
本小節測試數據如下,請先在數據庫中執行:
DROP TABLE IF EXISTS imooc_user;
CREATE TABLE imooc_user
(
id int PRIMARY KEY,
username varchar(20),
age int,
score int
);
INSERT INTO imooc_user(id,username,age,score)
VALUES (1,'peter', 18, 100),(2,'pedro', 24, 500),
(3,'jerry', 24, 500),(4,'mike', 18, 100),(5,'tom', 20, 1000);
提示: 如果你還不熟悉聚合函數,請先閱讀聚合函數小節。
3. Group By
Group By 會根據 By 后面的數據字段來分組,并且根據給定的聚合函數來分組進行聚合操作。
使用語法如下:
SELECT [agg] FROM [table_name] GROUP BY [col];
其中agg
表示聚合函數,table_name
表示數據表名稱,col
表示字段名稱。
3.1 例1 單字段Group By
請書寫 SQL 語句,將imooc_user
表中的用戶通過age
進行分組,并返回每個分組的用戶數。
分析:
題干中明確指出根據 age 進行分組,因此 Group By 應該后接 age,統計每個分組的用戶數使用聚合函數 Count。
語句:
整理可得語句如下:
SELECT age, COUNT(*) FROM imooc_user GROUP BY age;
結果如下:
+-----+----------+
| age | COUNT(*) |
+-----+----------+
| 18 | 2 |
| 24 | 2 |
| 20 | 1 |
+-----+----------+
提示:
COUNT(*)
在數據庫層面有專門的優化,其性能跟COUNT(1)
大致相同。
3.2 例2 多字段 Group By
Group By 不僅支持單字段分組,同時也支持多字段分組。
請書寫 SQL 語句,使用 age 和 score 字段對imooc_user
表中的用戶進行分組,并返回每個分組的用戶數。
分析:
題干中明確指出根據 age 和 score 進行分組,因此 Group By 應該后接 age,score,統計每個分組的用戶數使用聚合函數 Count。
語句:
整理可得語句如下:
SELECT age, score, COUNT(*) FROM imooc_user GROUP BY age, score;
結果如下:
+-----+-------+----------+
| age | score | COUNT(*) |
+-----+-------+----------+
| 18 | 100 | 2 |
| 24 | 500 | 2 |
| 20 | 1000 | 1 |
+-----+-------+----------+
4. Having
Having 不能單獨出現,須于聚合函數搭配使用,且常與 Group By 一起出現。Having 本身并無其他含義,它的主要功能是替代 Where。
使用語法如下:
SELECT [agg] FROM [table_name] GROUP BY [col] HAVING [condition];
其中agg
表示聚合函數,table_name
表示數據表名稱,col
表示字段名稱,condition
表示過濾條件。
4.1 例3 使用 Having
請書寫 SQL 語句,將imooc_user
表中的用戶通過 age 進行分組,并返回每個分組的用戶數,且每個分組的用戶數必須大于1
。
分析:
題干中明確指出根據 age 進行分組,因此 Group By 應該后接 age,統計每個分組的用戶數使用聚合函數 Count,且使用 Having 過濾。
語句:
整理可得語句如下:
SELECT age, COUNT(*) FROM imooc_user GROUP BY age HAVING COUNT(*) > 1;
結果如下:
+-----+----------+
| age | COUNT(*) |
+-----+----------+
| 18 | 2 |
| 24 | 2 |
+-----+----------+
5. 小結
- Group By 和 Having 常被用于數據分析和統計,是可視化和報表的利器。
- Having 局限于聚合函數,它無法使用在其它場景下。