MySQL探祕(二)：SQL語句執行過程詳解

程式設計師歷小冰發表於2018-08-12

原文網址 : https://juejin.im/post/5b7036de6fb9a009c40997eb

昔日庖丁解牛，未見全牛，所賴者是其對牛內部骨架結構的瞭解，對於MySQL亦是如此，只有更加全面地瞭解SQL語句執行的每個過程，才能更好的進行SQL的設計和優化。當希望MySQL能夠以更高的效能執行查詢時，最好的辦法就是弄清楚MySQL是如何優化和執行查詢的。一旦理解了這一點，很多查詢優化工作實際上就是遵循一些原則能夠按照預想的合理的方式執行。如下圖所示，當向MySQL傳送一個請求的時候，MySQL到底做了什麼：

客戶端傳送一條查詢給伺服器。
伺服器先檢查查詢快取，如果命中了快取，則立刻返回儲存在快取中的結果。否則進入下一階段。
伺服器端進行SQL解析、預處理，再由優化器生成對應的執行計劃。
MySQL根據優化器生成的執行計劃，再呼叫儲存引擎的API來執行查詢。
將結果返回給客戶端。

查詢快取

MySQL查詢快取儲存查詢返回的完整結構。當查詢命中該快取時，MySQL會立刻返回結果，跳過了解析、優化和執行階段。查詢快取系統會跟蹤查詢中涉及的每個表，如果這些表發生了變化，那麼和這個表相關的所有快取資料都將失效。 MySQL將快取存放在一個引用表中，通過一個雜湊值引用，這個雜湊值包括了以下因素，即查詢本身、當前要查詢的資料庫、客戶端協議的版本等一些其他可能影響返回結果的資訊。當判斷快取是否命中時，MySQL不會進行解析查詢語句，而是直接使用SQL語句和客戶端傳送過來的其他原始資訊。所以，任何字元上的不同，例如空格、註解等都會導致快取的不命中。當查詢語句中有一些不確定的資料時，則不會被快取。例如包含函式NOW()或者CURRENT_DATE()的查詢不會快取。包含任何使用者自定義函式，儲存函式，使用者變數，臨時表，mysql資料庫中的系統表或者包含任何列級別許可權的表，都不會被快取。有一點需要注意，MySQL並不是會因為查詢中包含一個不確定的函式而不檢查查詢快取，因為檢查查詢快取之前，MySQL不會解析查詢語句，所以也無法知道語句中是否有不確定的函式。事實則是，如果查詢語句中包含任何的不確定的函式，那麼其查詢結果不會被快取，因為查詢快取中也無法找到對應的快取結果。有關查詢快取的配置如下所示。

query_cache_type:是否開啟查詢快取。可以設定為OFF、ON和DEMAND。DEMAND表示只有在查詢語句中明確寫明SQL_CACHE的語句才會放入查詢快取。
query_cache_size:查詢快取使用的總記憶體空間。
query_cache_min_res_unit:在查詢快取中分配記憶體塊時的最小單元。較小的該值可以減少碎片導致的記憶體空間浪費，但是會導致更頻繁的記憶體塊操作。
query_cache_limit:MySQL能夠查詢的最大查詢結果。如果查詢結果大於這個值，則不會被快取。因為查詢快取在資料生成的時候就開始嘗試快取資料，所以當結果全部返回後，MySQL才知道查詢結果是否超出限制。超出之後，才會將結果從查詢快取中刪除。

對查詢快取的優化是資料庫效能優化的重要一環。判斷流程大致如下圖所示。

快取命中率可以通過如下公式計算：Qcache_hits/(Qcache_hits + Com_select)來計算。

解析和預處理

解析器通過關鍵字將SQL語句進行解析，並生成對應的解析樹。MySQL解析器將使用MySQL語法規則驗證和解析查詢。前處理器則根據一些MySQL規則進行進一步檢查解析書是否合法，例如檢查資料表和資料列是否存在，還會解析名字和別名，看看它們是否有歧義。

查詢優化器

查詢優化器會將解析樹轉化成執行計劃。一條查詢可以有多種執行方法，最後都是返回相同結果。優化器的作用就是找到這其中最好的執行計劃。生成執行計劃的過程會消耗較多的時間，特別是存在許多可選的執行計劃時。如果在一條SQL語句執行的過程中將該語句對應的最終執行計劃進行快取，當相似的語句再次被輸入伺服器時，就可以直接使用已快取的執行計劃，從而跳過SQL語句生成執行計劃的整個過程，進而可以提高語句的執行速度。

MySQL使用基於成本的查詢優化器(Cost-Based Optimizer，CBO)。它會嘗試預測一個查詢使用某種執行計劃時的成本，並選擇其中成本最少的一個。優化器會根據優化規則對關係表示式進行轉換，這裡的轉換是說一個關係表示式經過優化規則後會生成另外一個關係表示式，同時原有表示式也會保留，經過一系列轉換後會生成多個執行計劃，然後CBO會根據統計資訊和代價模型(Cost Model)計算每個執行計劃的Cost，從中挑選Cost最小的執行計劃。由上可知，CBO中有兩個依賴：統計資訊和代價模型。統計資訊的準確與否、代價模型的合理與否都會影響CBO選擇最優計劃。有關優化器的原理十分複雜，這裡就不進行詳細講解了，大家可以自行學習。

查詢執行引擎

在解析和優化階段，MySQL將生成查詢對應的執行計劃，MySQL的查詢執行引擎根據這個執行計劃來完成整個查詢。這裡執行計劃是一個資料結構，而不是和其他的關係型資料庫那樣生成對應的位元組碼。

返回結果給客戶端

如果查詢可以被快取，那麼MySQL在這個階段頁會將結果存放到查詢快取中。 MySQL將結果集返回給客戶端是一個增量、逐步返回的過程。在查詢生成第一條結果時，MySQL就可以開始向客戶端逐步返回結果集了。

訂閱最新文章，歡迎關注我的微信公眾號

參考

SQL優化器原理——查詢優化器綜述 zhuanlan.zhihu.com/p/40478975
《高效能MySQL》
《MySQL技術內幕-InnoDB儲存引擎》

mysql執行sql語句過程
2021-09-09
MySql
一條sql語句的執行過程
2021-02-22
SQL
MySQL系列之一條SQL查詢語句的執行過程
2018-11-21
MySql
Oracle資料庫SQL語句執行過程
2019-01-15
Oracle資料庫SQL
GaussDB SQL查詢語句執行過程解析
2024-04-24
SQL
MySQL 查詢語句執行過程淺析
2022-01-25
MySql
mysql的sql語句執行流程
2018-12-03
MySql
MySQL語句執行分析（二）
2018-09-28
MySql
深入解讀MySQL InnoDB儲存引擎Update語句執行過程
2022-12-18
MySql儲存引擎
一條 sql 的執行過程詳解
2020-12-03
SQL
MySQL cron定時執行SQL語句
2018-12-27
MySql
Mybatis原始碼分析（五）探究SQL語句的執行過程
2019-03-10
MyBatis原始碼SQL
MySQL資料庫詳解（一）SQL查詢語句是如何執行的？
2019-06-09
MySql資料庫
mysql sql語句執行超時設定
2018-09-29
MySql
PostgreSQL的insert語句執行過程分析
2022-03-18
SQL
MySQL全文索引原始碼剖析之Insert語句執行過程
2024-05-20
MySql索引原始碼
MySQL 中一條 sql 的執行過程
2023-02-01
MySql
[zebra原始碼]分片語句ShardPreparedStatement執行過程
2021-07-16
原始碼
SQL語句執行順序
2018-06-27
SQL
sql語句如何執行的
2020-10-17
SQL
一條SQL語句在MySQL中如何執行的
2019-04-19
MySql
PostgreSQL 原始碼解讀（15）- Insert語句(執行過程跟蹤)
2018-08-10
SQL原始碼
mySQL 執行語句執行順序
2020-12-29
MySql
一條sql語句在mysql中是如何執行的
2019-03-21
MySql
一條 SQL 語句在 MySQL 中是如何執行的？
2024-09-22
MySql
獲取oracle sql語句詳細些執行計劃
2018-12-18
OracleSQL
sql語句執行緩慢分析
2018-11-19
SQL
SQL 語句的執行順序
2018-12-25
SQL
後臺執行SQL語句(oracle)
2022-03-23
SQLOracle
Mybatis 動態執行SQL語句
2021-07-29
MyBatisSQL
MySQL語句執行分析（一）
2018-09-26
MySql
mysql中一條查詢語句的執行全過程是怎樣的？
2023-11-07
MySql
MySQL中UPDATE語句裡SET後使用AND的執行過程和結果分析
2021-01-24
MySql
Mysql之一次完成的sql執行過程
2024-07-21
MySql
MySQL儲存過程語句及呼叫
2018-11-30
MySql儲存過程
從一條更新SQL的執行過程窺探InnoDB之REDOLOG
2022-08-18
SQL
一個 MySQL sql 語句執行順序帶來的 bug
2019-05-27
MySql
MySQL日誌（一條sql更新語句是如何執行的）
2020-12-08
MySql