13. 分組資料

hisun9發表於2024-10-29

原文網址 : https://www.cnblogs.com/hisun9/p/18514746

1. 資料分組

分組允許把資料分為多個邏輯組，以便能對每個組進行聚集計算

2. 建立分組

分組是在SELECT語句的GROUP BY子句中建立的。

比如：

select vend_id, count(*) as num_prods
from products
group by vend_id;

輸出如下：

上面的SELECT語句指定了兩個列，vend_id包含產品供應商的ID，num_prods為計算欄位（用COUNT(*)函式建立）。GROUP BY子句指示MySQL按vend_id排序並分組資料。這導致對每個vend_id而不是整個表計算num_prods一次。

從輸出中可以看到，供應商1001有3個產品，供應商1002有2個產品，供應商1003有7個產品，而供應商1005有2個產品。

因為使用了GROUP BY，就不必指定要計算和估值的每個組了。系統會自動完成。

GROUP BY子句指示MySQL分組資料，然後對每個組而不是整個結果集進行聚集。

在具體使用GROUP BY子句前，需要知道一些重要的規定:

GROUP BY子句可以包含任意數目的列。這使得能對分組進行巢狀（“GROUP BY 可以巢狀分組”是指在 GROUP BY 子句中可以指定多個列進行分組），為資料分組提供更細緻的控制。
如果在GROUP BY子句中巢狀了分組，資料將在最後規定的分組上進行彙總。換句話說，在建立分組時，指定的所有列都一起計算（所以不能從個別的列取回資料）。

補充：

“如果在 GROUP BY 子句中巢狀了分組，資料將在最後規定的分組上進行彙總”指的是在多層分組時，最終的聚合結果是基於最後一個分組條件進行彙總的。這意味著在所有指定的分組條件中，最後一個分組條件決定了最終的彙總結果。

具體解釋
- 分組的順序：當你在 GROUP BY 中指定多個列時，資料庫會首先按第一個列分組，然後在每個分組內再按第二個列分組，以此類推，直到最後一個列。最終的彙總是基於最後一個列。
- 最終彙總的依據：最後一個列的分組決定了如何計算聚合函式（如 SUM、COUNT 等）。這意味著在所有的分組中，最後一個分組的結果將是你查詢返回的主要彙總資訊。
GROUP BY子句中列出的每個列都必須是檢索列或有效的表示式（但不能是聚集函式）。如果在SELECT中使用表示式，則必須在GROUP BY子句中指定相同的表示式。不能使用別名。（不太理解，總感覺有點問題，不管這條了）

不過這樣寫是錯的：

這樣寫也是錯的：
除聚集計算語句外，SELECT語句中的每個列都必須在GROUP BY子句中給出。
如果分組列中具有NULL值，則NULL將作為一個分組返回。如果列中有多行NULL值，它們將分為一組。
GROUP BY子句必須出現在WHERE子句之後，ORDER BY子句之前。

補充：

使用ROLLUP：

使用WITH ROLLUP關鍵字，可以得到每個分組以及每個分組彙總級別（針對每個分組）的值。

比如：

select vend_id, count(*) as num_prods
from products
group by vend_id with rollup;

輸出如下：

3. 過濾分組

除了能用GROUP BY分組資料外，MySQL還允許過濾分組，規定包括哪些分組，排除哪些分組。

例如，可能想要列出至少有兩個訂單的所有顧客。為得出這種資料，必須基於完整的分組而不是個別的行進行過濾。

我們已經看到了WHERE子句的作用（第6章中引入）。但是，在這個例子中WHERE不能完成任務，因為WHERE過濾指定的是行而不是分組。事實上，WHERE沒有分組的概念。

MySQL為此目的提供了另外的子句，那就是HAVING子句。

HAVING非常類似於WHERE。事實上，目前為止所學過的所有型別的WHERE子句都可以用HAVING來替代。唯一的差別是WHERE過濾行，而HAVING過濾分組。

補充：

HAVING支援所有WHERE運算子：

在第6章和第7章中，我們學習了WHERE子句的條件（包括萬用字元條件和帶多個運算子的子句）。所學過的有關WHERE的所有這些技術和選項都適用於HAVING。它們的句法是相同的，只是關鍵字有差別。

怎麼過濾分組呢？請看：

select cust_id, count(*) as orders
from orders
group by cust_id
having count(*) >= 2;

輸出如下：

最後一行增加了HAVING子句，它過濾COUNT(*) >=2（兩個以上的訂單）的那些分組。

注意：

HAVING和WHERE的差別

這裡有另一種理解方法，WHERE在資料分組前進行過濾，HAVING在資料分組後進行過濾。這是一個重要的區別，WHERE排除的行不包括在分組中。

那麼，有沒有在一條語句中同時使用WHERE和HAVING子句的需要呢？事實上，確實有。

假如想進一步過濾上面的語句，使它返回過去12個月內具有兩個以上訂單的顧客。為達到這一點，可增加一條WHERE子句，過濾出過去12個月內下過的訂單。然後再增加HAVING子句過濾出具有兩個以上訂單的分組。

比如下面的例子，它列出具有2個（含）以上、價格為10（含）以上的產品的供應商：

select vend_id, count(*) as num_prods
from products
where prod_price >= 10
group by vend_id
having count(*) >= 2;

輸出如下：

4. 分組和排序

GROUP BY 和 ORDER BY 是非常不同的。表13-1彙總了它們之間的差別。

（這個圖也有點不理解，特別是第三條，不知道這個對不對）

表13-1中列出的第一項差別極為重要。我們經常發現用GROUP BY分組的資料確實是以分組順序輸出的。但情況並不總是這樣，它並不是SQL規範所要求的。

此外，使用者也可能會要求以不同於分組的順序排序。僅因為你以某種方式分組資料（獲得特定的分組聚集值），並不表示你需要以相同的方式排序輸出。

應該提供明確的ORDER BY子句，即使其效果等同於GROUP BY子句也是如此。

解釋下上面那段話是啥意思：

注意：

不要忘記ORDER BY：

一般在使用GROUP BY子句時，應該也給出ORDER BY子句。這是保證資料正確排序的唯一方法。千萬不要僅依賴GROUP BY排序資料。

為說明GROUP BY和ORDER BY的使用方法，舉個例子，它檢索總計訂單價格大於等於50的訂單的訂單號和總計訂單價格：

select order_num, sum(quantity * item_price) as ordertotal
from orderitems
group by order_num
having sum(quantity * item_price) >= 50;

輸出如下：

為按總計訂單價格排序輸出，需要新增ORDER BY子句，如下所示：

select order_num, sum(quantity * item_price) as ordertotal
from orderitems
group by order_num
having sum(quantity * item_price) >= 50
order by ordertotal;

在這個例子中，GROUP BY子句用來按訂單號（order_num列）分組資料，以便SUM(*)函式能夠返回總計訂單價格。HAVING子句過濾資料，使得只返回總計訂單價格大於等於50的訂單。最後，用ORDER BY子句排序輸出。

5. SELECT子句順序

表13-2以在SELECT語句中使用時必須遵循的次序，列出迄今為止所學過的子句。

分組資料
2024-05-29
vxe-table 實現表格資料分組，按指定欄位資料分組
2024-11-27
抓包概念大比較：資料包、資料包、分組
2020-04-04
課時13.標籤的分類（掌握）
2018-06-12
資料庫之DQL排序&分組&函式
2020-12-28
資料庫排序函式
sql 按著時間分組，每組取 20 條資料
2020-07-13
SQL
什麼是組合資料型別?Python組合資料型別分為幾類?
2021-08-06
資料型別Python
WPF/C#：如何將資料分組顯示
2024-06-17
C#
MySQL資料庫中的分組函式ROLLUP
2024-05-30
MySql資料庫函式
javascript: 帶分組資料的Table表頭排序
2021-09-09
JavaScript排序
13.計算機網路的結構組成
2020-11-06
計算機網路
如何在分組報表中實現組內資料補空行及組內頁碼
2019-12-05
資料分析中不進行資料分組會產生辛普森悖論 - TivadarDanka
2022-03-17
WPF/C#：顯示分組資料的兩種方式
2024-06-19
C#
Mac“照片”中如何把資料夾中的相簿分組？
2021-11-08
Mac
K 均值演算法-如何讓資料自動分組
2020-12-04
演算法
MySQL分組查詢後獲取前N條資料
2020-12-25
MySql
資料治理與資料分類分級！
2023-12-15
BF的資料結構題單-提高組——樹鏈剖分
2020-11-14
資料結構
Go 語言之對不同型別的資料進行分組
2022-11-02
Go型別
13. Roman to Integer
2019-03-14
大資料資料庫讀寫分離分庫分表
2021-01-01
大資料資料庫
（資料科學學習手札99）掌握pandas中的時序資料分組運算
2020-12-08
資料科學
Laravel-admin 實現一個分組求和的資料展現
2019-02-27
Laravel
分組
2024-06-25
資料劃分
2018-08-27
分庫分表插入資料
2020-12-09
【raid5資料恢復案例】兩組分別由4塊SAS硬碟組成的raid5組成lvm結構的資料恢復方案
2021-11-30
AI資料恢復硬碟LVM
統計資料按日期分組，沒有的天補零，什麼辦
2019-03-22
SQL-分組聚合 - 單欄位分組
2024-12-04
SQL
快速入門pandas進行資料探勘資料分析[多維度排序、資料篩選、分組計算、透視表](一)
2023-02-03
排序
MYSQL——分組
2024-06-12
MySql
分組排名
2024-06-09
WPF 分組
2022-05-21
swift4.0 物件資料來源根據屬性分組,時間排序
2018-03-06
Swift物件排序
python3 筆記13.列表元組的切片和支援的運算方法
2018-10-18
Python筆記
真菌基因組資料庫
2018-03-10
資料庫
資料分析---matplotlib模組
2024-06-21

13. 分組資料

1. 資料分組

2. 建立分組

3. 過濾分組

4. 分組和排序

5. SELECT子句順序

相關文章