大家好,我是老三,今天分享一個小知識點——索引下推。
如果你在面試中,聽到MySQL5.6”、“索引優化” 之類的詞語,你就要立馬get到,這個問的是“索引下推”。
什麼是索引下推
索引下推(Index Condition Pushdown,簡稱ICP),是MySQL5.6版本的新特性,它能減少回表查詢次數,提高查詢效率。
索引下推優化的原理
我們先簡單瞭解一下MySQL大概的架構:
MySQL服務層負責SQL語法解析、生成執行計劃等,並呼叫儲存引擎層去執行資料的儲存和檢索。
索引下推
的下推其實就是指將部分上層(服務層)負責的事情,交給了下層(引擎層)去處理。
我們來具體看一下,在沒有使用ICP的情況下,MySQL的查詢:
- 儲存引擎讀取索引記錄;
- 根據索引中的主鍵值,定位並讀取完整的行記錄;
- 儲存引擎把記錄交給
Server
層去檢測該記錄是否滿足WHERE
條件。
使用ICP的情況下,查詢過程:
- 儲存引擎讀取索引記錄(不是完整的行記錄);
- 判斷
WHERE
條件部分能否用索引中的列來做檢查,條件不滿足,則處理下一行索引記錄; - 條件滿足,使用索引中的主鍵去定位並讀取完整的行記錄(就是所謂的回表);
- 儲存引擎把記錄交給
Server
層,Server
層檢測該記錄是否滿足WHERE
條件的其餘部分。
索引下推的具體實踐
理論比較抽象,我們來上一個實踐。
使用一張使用者表tuser
,表裡建立聯合索引(name, age)。
如果現在有一個需求:檢索出表中名字第一個字是張,而且年齡是10歲的所有使用者
。那麼,SQL語句是這麼寫的:
select * from tuser where name like '張%' and age=10;
假如你瞭解索引最左匹配原則,那麼就知道這個語句在搜尋索引樹的時候,只能用 張
,找到的第一個滿足條件的記錄id為1。
那接下來的步驟是什麼呢?
沒有使用ICP
在MySQL 5.6之前,儲存引擎根據通過聯合索引找到name likelike '張%'
的主鍵id(1、4),逐一進行回表掃描,去聚簇索引找到完整的行記錄,server層再對資料根據age=10進行篩選
。
我們看一下示意圖:
可以看到需要回表兩次,把我們聯合索引的另一個欄位age
浪費了。
使用ICP
而MySQL 5.6 以後, 儲存引擎根據(name,age)聯合索引,找到name likelike '張%'
,由於聯合索引中包含age
列,所以儲存引擎直接再聯合索引裡按照age=10
過濾。按照過濾後的資料再一一進行回表掃描。
我們看一下示意圖:
可以看到只回表了一次。
除此之外我們還可以看一下執行計劃,看到Extra
一列裡 Using index condition
,這就是用到了索引下推。
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
| 1 | SIMPLE | tuser | NULL | range | na_index | na_index | 102 | NULL | 2 | 25.00 | Using index condition |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
索引下推使用條件
- 只能用於
range
、ref
、eq_ref
、ref_or_null
訪問方法; - 只能用於
InnoDB
和MyISAM
儲存引擎及其分割槽表; - 對
InnoDB
儲存引擎來說,索引下推只適用於二級索引(也叫輔助索引);
索引下推的目的是為了減少回表次數,也就是要減少IO操作。對於
InnoDB
的聚簇索引來說,資料和索引是在一起的,不存在回表這一說。
- 引用了子查詢的條件不能下推;
- 引用了儲存函式的條件不能下推,因為儲存引擎無法呼叫儲存函式。
相關係統引數
索引條件下推預設是開啟的,可以使用系統引數optimizer_switch
來控制器是否開啟。
檢視預設狀態:
mysql> select @@optimizer_switch\G;
*************************** 1. row ***************************
@@optimizer_switch: index_merge=on,index_merge_union=on,index_merge_sort_union=on,index_merge_intersection=on,engine_condition_pushdown=on,index_condition_pushdown=on,mrr=on,mrr_cost_based=on,block_nested_loop=on,batched_key_access=off,materialization=on,semijoin=on,loosescan=on,firstmatch=on,duplicateweedout=on,subquery_materialization_cost_based=on,use_index_extensions=on,condition_fanout_filter=on,derived_merge=on
1 row in set (0.00 sec)
切換狀態:
set optimizer_switch="index_condition_pushdown=off";
set optimizer_switch="index_condition_pushdown=on";
參考:
[1].《 MySQL技術內幕 InnoDB儲存引擎》
[2]. 《MySQL實戰45講》