聊聊MySQL是如何處理排序的

华为云开发者联盟發表於2024-05-16

原文網址 : https://www.cnblogs.com/huaweiyun/p/18195305

MySql排序

本文分享自華為雲社群《MySQL怎樣處理排序⭐️如何最佳化需要排序的查詢？》，作者：菜菜的後端私房菜。

前言

在MySQL的查詢中常常會用到 order by 和 group by 這兩個關鍵字

它們的相同點是都會對欄位進行排序，那查詢語句中的排序是如何實現的呢？

當使用的查詢語句需要進行排序時有兩種處理情況：

當前記錄本來就是有序的，不需要進行排序
當前記錄未保持順序，需要排序

使用索引保證有序

對於第一種情況，常常是使用二級索引中索引列的有序來保證結果集有序，從而不需要進行排序

對於表a，為a2建立二級索引，那麼在二級索引上a2就是有序的

 CREATE TABLE `a` (
   `a1` int(11) NOT NULL AUTO_INCREMENT,
   `a2` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL,
   `a3` varchar(255) DEFAULT NULL,
   PRIMARY KEY (`a1`),
   KEY `idx_a2` (`a2`)
 ) ENGINE=InnoDB AUTO_INCREMENT=76 DEFAULT CHARSET=utf8;

select * from a order by a.a2 limit 10

當最佳化器選擇使用a2索引時，a2列的記錄本身就是有序的，因此不需要再使用其他開銷進行排序

當然，最佳化器也有可能不使用a2索引（當最佳化器認為使用a2回表開銷太大時會使用全表掃描）

當最佳化器使用的索引上a2無序時，則會透過其他手段對結果進行排序

filesort

當執行計劃的Extra附加資訊中出現 Using filesort 時，會使用sort_buffer對結果進行排序

sort_buffer是一塊用於排序的記憶體，sort_buffer可能存放查詢需要的所有欄位，也可能只存放需要排序的欄位和主鍵

show variables like 'max_length_for_sort_data'

當查詢需要的欄位長度小於 max_length_for_sort_data 時，則會將查詢需要的所有欄位放入sort_buffer中，然後對需要排序的列進行排序，最後返回結果

當查詢需要的欄位長度大於 max_length_for_sort_data 時，只會將需要排序的欄位和主鍵值放入sort_buffer中，等到排序後再去查詢聚簇索引獲取需要查詢的列（相當於又多了一次回表）

在sort_buffer中進行排序時，如果記憶體足夠則會在記憶體中進行排序，如果記憶體不夠則會使用磁碟的臨時檔案來輔助排序

開啟 optimizer_trace 可以檢視是否使用臨時檔案輔助排序

 #開啟最佳化器追蹤
 SET optimizer_trace='enabled=on'; 
 
 #sql語句
 select * from student order by student_name limit 10000;
 
 #檢視最佳化器追蹤的資訊
 SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G;

排序使用的演算法是歸併演算法，先分割成多個小檔案排序再進行合併

其中number_of_tmp_files 為使用到的臨時檔案數量，sort_buffer_size 為sort_buffer大小

因此當使用order by、group by等需要排序的關鍵字時，最好建立合適的索引

如果資料量小可以在sort buffer中排序，如果資料量太大還需要與磁碟互動

總結

當查詢語句需要排序時會分為不用排序和需要排序兩種情況

當使用的索引有序時則不用再進行排序，透過索引來保證有序

當使用的索引無序時則會使用sort_buffer進行排序，當查詢欄位的長度未超過限制時，sort_buffer中每條記錄會儲存需要查詢的列

如果超過限制，則sort_buffer只會儲存需要排序的列和主鍵值，排序後再透過主鍵值進行回表獲取需要查詢的列

當資料量太大不夠在記憶體中排序完，會使用磁碟頁輔助排序，使用歸併演算法將排序資料分散在多個頁再合併

可以透過追蹤最佳化器 optimizer_trace 分析內容檢視輔助頁的數量等資訊

為需要排序的列建立合適的索引，避免使用磁碟頁輔助排序

當無法使用索引時可以調整sort buffer 或 max_length_for_sort_data（謹慎）

點選關注，第一時間瞭解華為雲新鮮技術~

你知道MySQL是如何處理千萬級資料的嗎？
2020-08-10
MySql
MySQL 是如何實現資料的排序的？
2024-08-05
MySql排序
Mysql如何處理死鎖
2021-09-11
MySql
聊聊前端國際化文案該如何處理
2019-02-18
前端
Spring是如何處理註解的
2019-01-19
Spring
最全總結 | 聊聊 Python 資料處理全家桶（Mysql 篇）
2020-09-17
PythonMySql
重複提交，你是如何處理的？
2020-06-24
nginx 是如何處理過期事件的？
2020-10-18
Nginx事件
如何處理 MySQL 萬用字元的模糊查詢
2019-02-25
MySql字元
阿里是如何處理分散式事務的
2019-05-20
阿里分散式
Tomcat中的容器是如何處理請求的
2019-09-09
Tomcat
MySQL的表碎片處理
2018-12-12
MySql
為什麼處理排序的陣列要比非排序的快
2019-05-22
排序陣列
聊聊介面最大併發處理數
2023-11-21
mysql 1129處理
2021-05-18
MySql
Netty是如何處理新連線接入事件的？
2020-04-17
Netty事件
c語言是如何處理函式呼叫的？
2021-11-25
C語言函式
DM 是如何處理 DML 的丨TiDB 工具分享
2022-04-28
TiDB
MySQL 預設排序真的是按主鍵來排序的嗎
2018-09-03
MySql排序
淺析Node是如何進行錯誤處理的
2020-04-03
面對“套路貸”借貸寶是如何處理的？
2020-04-16
MySQL事務處理
2020-06-14
MySql
MySQL 併發處理
2018-03-23
MySql
你是如何更好地處理Async/Await的異常的？
2024-11-24
AI
聊聊專案中定時任務的處理方式
2023-02-05
什麼是殭屍程式以及如何處理
2020-09-21
Laravel 底層是如何處理HTTP請求
2021-02-04
LaravelHTTP
JSP 異常處理如何處理？
2021-09-01
JS
Mysql如何處理重複資料？讓你的效率更高效
2020-08-04
MySql
【問題處理】MySQL忘記root密碼的處理辦法
2021-01-05
MySql密碼
Kafka是如何處理Netflix每天2萬億條訊息的？
2019-01-17
Kafka
「Go框架」gin框架是如何做崩潰處理的？
2023-05-18
Go框架
MySQL show processlist故障處理
2021-12-22
MySql
如果新增欄位是外來鍵，如何處理？
2020-04-04
為什麼處理排序陣列比未排序陣列快
2018-11-30
排序陣列
SDWebImage載入圖片的URL是同一個（如何處理）
2018-04-09
Web
蘋果A12是四核還是六核處理器？iPhone Xs的處理器是幾核的
2018-09-13
蘋果iPhone
DRF 過濾排序分頁異常處理
2022-04-07
排序

聊聊MySQL是如何處理排序的

前言

使用索引保證有序

filesort

總結

相關文章