面試官：聊聊索引失效？失效的原因是什麼？

小林coding發表於2022-01-24

原文網址 : https://www.cnblogs.com/xiaolincoding/p/15839040.html

面試索引

大家好，我是小林。

在工作中，如果我們想提高一條語句查詢速度，通常都會想對欄位建立索引。

但是索引並不是萬能的。建立了索引，並不意味著任何查詢語句都能走索引掃描。

稍不注意，可能你寫的查詢語句是會導致索引失效，從而走了全表掃描，雖然查詢的結果沒問題，但是查詢的效能大大降低。

今天就來跟大家盤一盤，常見的 6 種會發生索引失效的場景。

不僅會用實驗案例給大家說明，也會清楚每個索引失效的原因。

發車！

圖片

索引儲存結構長什麼樣？

我們先來看看索引儲存結構長什麼樣？因為只有知道索引的儲存結構，才能更好的理解索引失效的問題。

索引的儲存結構跟 MySQL 使用哪種儲存引擎有關，因為儲存引擎就是負責將資料持久化在磁碟中，而不同的儲存引擎採用的索引資料結構也會不相同。

MySQL 預設的儲存引擎是 InnoDB，它採用 B+Tree 作為索引的資料結構，至於為什麼選擇 B+ 樹作為索引的資料結構，詳細的分析可以看我這篇文章：為什麼 MySQL 喜歡 B+ 樹？

在建立表時，InnoDB 儲存引擎預設會建立一個主鍵索引，也就是聚簇索引，其它索引都屬於二級索引。

MySQL 的 MyISAM 儲存引擎支援多種索引資料結構，比如 B+ 樹索引、R 樹索引、Full-Text 索引。MyISAM 儲存引擎在建立表時，建立的主鍵索引預設使用的是 B+ 樹索引。

雖然，InnoDB 和 MyISAM 都支援 B+ 樹索引，但是它們資料的儲存結構實現方式不同。不同之處在於：

InnoDB 儲存引擎：B+ 樹索引的葉子節點儲存資料本身；
MyISAM 儲存引擎：B+ 樹索引的葉子節點儲存資料的實體地址；

接下來，我舉個例子，給大家展示下這兩種儲存引擎的索引儲存結構的區別。

這裡有一張 t_user 表，其中 id 欄位為主鍵索引，其他都是普通欄位。

圖片

如果使用的是 MyISAM 儲存引擎，B+ 樹索引的葉子節點儲存資料的實體地址，即使用者資料的指標，如下圖：

圖片

如果使用的是 InnoDB 儲存引擎， B+ 樹索引的葉子節點儲存資料本身，如下圖所示：

圖片

InnoDB 儲存引擎根據索引型別不同，分為聚簇索引（上圖就是聚簇索引）和二級索引。它們區別在於，聚簇索引的葉子節點存放的是實際資料，所有完整的使用者資料都存放在聚簇索引的葉子節點，而二級索引的葉子節點存放的是主鍵值，而不是實際資料。

如果將 name 欄位設定為普通索引，那麼這個二級索引長下圖這樣，葉子節點僅存放主鍵值。

圖片

知道了 InnoDB 儲存引擎的聚簇索引和二級索引的儲存結構後，接下來舉幾個查詢語句，說下查詢過程是怎麼選擇用哪個索引型別的。

在我們使用「主鍵索引」欄位作為條件查詢的時候，如果要查詢的資料都在「聚簇索引」的葉子節點裡，那麼就會在「聚簇索引」中的 B+ 樹檢索到對應的葉子節點，然後直接讀取要查詢的資料。如下面這條語句：

// id 欄位為主鍵索引
select * from t_user where id=1;

在我們使用「二級索引」欄位作為條件查詢的時候，如果要查詢的資料都在「聚簇索引」的葉子節點裡，那麼需要檢索兩顆B+樹：

先在「二級索引」的 B+ 樹找到對應的葉子節點，獲取主鍵值；
然後用上一步獲取的主鍵值，在「聚簇索引」中的 B+ 樹檢索到對應的葉子節點，然後獲取要查詢的資料。

上面這個過程叫做回表，如下面這條語句：

// name 欄位為二級索引
select * from t_user where name="林某";

在我們使用「二級索引」欄位作為條件查詢的時候，如果要查詢的資料在「二級索引」的葉子節點，那麼只需要在「二級索引」的 B+ 樹找到對應的葉子節點，然後讀取要查詢的資料，這個過程叫做覆蓋索引。如下面這條語句：

// name 欄位為二級索引
select id from t_user where name="林某";

上面這些查詢語句的條件都用到了索引列，所以在查詢過程都用上了索引。

但是並不意味著，查詢條件用上了索引列，就查詢過程就一定都用上索引，接下來我們再一起看看哪些情況會導致索引實現，而發生全表掃描。

首先說明下，下面的實驗案例，我使用的 MySQL 版本為 8.0.26。

對索引使用左或者左右模糊匹配

當我們使用左或者左右模糊匹配的時候，也就是 like %xx 或者 like %xx% 這兩種方式都會造成索引失效。

比如下面的 like 語句，查詢 name 字尾為「林」的使用者，執行計劃中的 type=ALL 就代表了全表掃描，而沒有走索引。

// name 欄位為二級索引
select * from t_user where name like '%林';

圖片

如果是查詢 name 字首為林的使用者，那麼就會走索引掃描，執行計劃中的 type=range 表示走索引掃描，key=index_name 看到實際走了 index_name 索引：

// name 欄位為二級索引
select * from t_user where name like '林%';

圖片

為什麼 like 關鍵字左或者左右模糊匹配無法走索引呢？

因為索引 B+ 樹是按照「索引值」有序排列儲存的，只能根據字首進行比較。

舉個例子，下面這張二級索引圖，是以 name 欄位有序排列儲存的。

圖片

假設我們要查詢 name 欄位字首為「林」的資料，也就是 name like '林%'，掃描索引的過程：

首節點查詢比較：林這個字的拼音大小比首節點的第一個索引值中的陳字大，但是比首節點的第二個索引值中的周字小，所以選擇去節點2繼續查詢；
節點 2 查詢比較：節點2的第一個索引值中的陳字的拼音大小比林字小，所以繼續看下一個索引值，發現節點2有與林字字首匹配的索引值，於是就往葉子節點查詢，即葉子節點4；
節點 4 查詢比較：節點4的第一個索引值的字首符合林字，於是就讀取該行資料，接著繼續往右匹配，直到匹配不到字首為林的索引值。

如果使用 name like '%林' 方式來查詢，因為查詢的結果可能是「陳林、張林、周林」等之類的，所以不知道從哪個索引值開始比較，於是就只能通過全表掃描的方式來查詢。

想要更詳細瞭解 InnoDB 的 B+ 樹查詢過程，可以看我寫的這篇：B+ 樹裡的節點裡存放的是什麼呢？查詢資料的過程又是怎樣的？

對索引使用函式

有時候我們會用一些 MySQL 自帶的函式來得到我們想要的結果，這時候要注意了，如果查詢條件中對索引欄位使用函式，就會導致索引失效。

比如下面這條語句查詢條件中對 name 欄位使用了 LENGTH 函式，執行計劃中的 type=ALL，代表了全表掃描：

// name 為二級索引
select * from t_user where length(name)=6;

圖片

為什麼對索引使用函式，就無法走索引了呢？

因為索引儲存的是索引欄位的原始值，而不是經過函式計算後的值，自然就沒辦法走索引了。

不過，從 MySQL 8.0 開始，索引特性增加了函式索引，即可以針對函式計算後的值建立一個索引，也就是說該索引的值是函式計算後的值，所以就可以通過掃描索引來查詢資料。

舉個例子，我通過下面這條語句，對 length(name) 的計算結果建立一個名為 idx_name_length 的索引。

alter table t_user add key idx_name_length ((length(name)));

然後我再用下面這條查詢語句，這時候就會走索引了。

圖片

對索引進行表示式計算

在查詢條件中對索引進行表示式計算，也是無法走索引的。

比如，下面這條查詢語句，執行計劃中 type = ALL，說明是通過全表掃描的方式查詢資料的：

explain select * from t_user where id + 1 = 10;

圖片

但是，如果把查詢語句的條件改成 where id = 10 - 1，這樣就不是在索引欄位進行表示式計算了，於是就可以走索引查詢了。

圖片

為什麼對索引進行表示式計算，就無法走索引了呢？

原因跟對索引使用函式差不多。

因為索引儲存的是索引欄位的原始值，而不是 id + 1 表示式計算後的值，所以無法走索引，只能通過把索引欄位的取值都取出來，然後依次進行表示式的計算來進行條件判斷，因此採用的就是全表掃描的方式。

有的同學可能會說，這種對索引進行簡單的表示式計算，在程式碼特殊處理下，應該是可以做到索引掃描的，比方將 id + 1 = 10 變成 id = 10 - 1。

是的，是能夠實現，但是 MySQL 還是偷了這個懶，沒有實現。

我的想法是，可能也是因為，表示式計算的情況多種多樣，每種都要考慮的話，程式碼可能會很臃腫，所以乾脆將這種索引失效的場景告訴程式設計師，讓程式設計師自己保證在查詢條件中不要對索引進行表示式計算。

對索引隱式型別轉換

如果索引欄位是字串型別，但是在條件查詢中，輸入的引數是整型的話，你會在執行計劃的結果發現這條語句會走全表掃描。

我在原本的 t_user 表增加了 phone 欄位，是二級索引且型別是 varchar。

圖片

然後我在條件查詢中，用整型作為輸入引數，此時執行計劃中 type = ALL，所以是通過全表掃描來查詢資料的。

select * from t_user where phone = 1300000001;

圖片

但是如果索引欄位是整型型別，查詢條件中的輸入引數即使字串，是不會導致索引失效，還是可以走索引掃描。

我們再看第二個例子，id 是整型，但是下面這條語句還是走了索引掃描的。

 explain select * from t_user where id = '1';

圖片

為什麼第一個例子會導致索引失效，而第二例子不會呢？

要明白這個原因，首先我們要知道 MySQL 的資料型別轉換規則是什麼？就是看 MySQL 是會將字串轉成數字處理，還是將數字轉換成字串處理。

我在看《mysql45講的時候》看到一個簡單的測試方式，就是通過 select “10” > 9 的結果來知道MySQL 的資料型別轉換規則是什麼：

如果規則是 MySQL 會將自動「字串」轉換成「數字」，就相當於 select 10 > 9，這個就是數字比較，所以結果應該是 1；
如果規則是 MySQL 會將自動「數字」轉換成「字串」，就相當於 select "10" > "9"，這個是字串比較，字串比較大小是逐位從高位到低位逐個比較（按ascii碼），那麼"10"字串相當於 “1”和“0”字元的組合，所以先是拿 “1” 字元和 “9” 字元比較，因為 “1” 字元比 “9” 字元小，所以結果應該是 0。

在 MySQL 中，執行的結果如下圖：

圖片

上面的結果為 1，說明 MySQL 在遇到字串和數字比較的時候，會自動把字串轉為數字，然後再進行比較。

前面的例子一中的查詢語句，我也跟大家說了是會走全表掃描：

//例子一的查詢語句
select * from t_user where phone = 1300000001;

這是因為 phone 欄位為字串，所以 MySQL 要會自動把字串轉為數字，所以這條語句相當於：

select * from t_user where CAST(phone AS signed int) = 1300000001;

可以看到，CAST 函式是作用在了 phone 欄位，而 phone 欄位是索引，也就是對索引使用了函式！而前面我們也說了，對索引使用函式是會導致索引失效的。

例子二中的查詢語句，我跟大家說了是會走索引掃描：

//例子二的查詢語句
select * from t_user where id = "1";

這時因為字串部分是輸入引數，也就需要將字串轉為數字，所以這條語句相當於：

select * from t_user where id = CAST("1" AS signed int);

可以看到，索引欄位並沒有用任何函式，CAST 函式是用在了輸入引數，因此是可以走索引掃描的。

聯合索引非最左匹配

對主鍵欄位建立的索引叫做聚簇索引，對普通欄位建立的索引叫做二級索引。

那麼多個普通欄位組合在一起建立的索引就叫做聯合索引，也叫組合索引。

建立聯合索引時，我們需要注意建立時的順序問題，因為聯合索引 (a, b, c) 和 (c, b, a) 在使用的時候會存在差別。

聯合索引要能正確使用需要遵循最左匹配原則，也就是按照最左優先的方式進行索引的匹配。

比如，如果建立了一個 (a, b, c) 聯合索引，如果查詢條件是以下這幾種，就可以匹配上聯合索引：

where a=1；
where a=1 and b=2 and c=3；
where a=1 and b=2；

需要注意的是，因為有查詢優化器，所以 a 欄位在 where 子句的順序並不重要。

但是，如果查詢條件是以下這幾種，因為不符合最左匹配原則，所以就無法匹配上聯合索引，聯合索引就會失效:

where b=2；
where c=3；
where b=2 and c=3；

有一個比較特殊的查詢條件：where a = 1 and c = 3 ，符合最左匹配嗎？

這種其實嚴格意義上來說是屬於索引截斷，不同版本處理方式也不一樣。

MySQL 5.5 的話，前面 a 會走索引，在聯合索引找到主鍵值後，開始回表，到主鍵索引讀取資料行，然後再比對 c 欄位的值。

從 MySQL5.6 之後，有一個索引下推功能，可以在索引遍歷過程中，對索引中包含的欄位先做判斷，直接過濾掉不滿足條件的記錄，減少回表次數。

大概原理是：截斷的欄位會被下推到儲存引擎層進行條件判斷（因為 c 欄位的值是在 (a, b, c) 聯合索引裡的），然後過濾出符合條件的資料後再返回給 Server 層。由於在引擎層就過濾掉大量的資料，無需再回表讀取資料來進行判斷，減少回表次數，從而提升了效能。

比如下面這條 where a = 1 and c = 0 語句，我們可以從執行計劃中的 Extra=Using index condition 使用了索引下推功能。

圖片

為什麼聯合索引不遵循最左匹配原則就會失效？

原因是，在聯合索引的情況下，資料是按照索引第一列排序，第一列資料相同時才會按照第二列排序。

也就是說，如果我們想使用聯合索引中儘可能多的列，查詢條件中的各個列必須是聯合索引中從最左邊開始連續的列。如果我們僅僅按照第二列搜尋，肯定無法走索引。

WHERE 子句中的 OR

在 WHERE 子句中，如果在 OR 前的條件列是索引列，而在 OR 後的條件列不是索引列，那麼索引會失效。

舉個例子，比如下面的查詢語句，id 是主鍵，age 是普通列，從執行計劃的結果看，是走了全表掃描。

select * from t_user where id = 1 or age = 18;

圖片

這是因為 OR 的含義就是兩個只要滿足一個即可，因此只有一個條件列是索引列是沒有意義的，只要有條件列不是索引列，就會進行全表掃描。

要解決辦法很簡單，將 age 欄位設定為索引即可。

圖片

可以看到 type=index merge， index merge 的意思就是對 id 和 age 分別進行了掃描，然後將這兩個結果集進行了合併，這樣做的好處就是避免了全表掃描。

總結

今天給大家介紹了 6 種會發生索引失效的情況：

當我們使用左或者左右模糊匹配的時候，也就是 like %xx 或者 like %xx%這兩種方式都會造成索引失效；
當我們在查詢條件中對索引列使用函式，就會導致索引失效。
當我們在查詢條件中對索引列進行表示式計算，也是無法走索引的。
MySQL 在遇到字串和數字比較的時候，會自動把字串轉為數字，然後再進行比較。如果字串是索引列，而條件語句中的輸入引數是數字的話，那麼索引列會發生隱式型別轉換，由於隱式型別轉換是通過 CAST 函式實現的，等同於對索引列使用了函式，所以就會導致索引失效。
聯合索引要能正確使用需要遵循最左匹配原則，也就是按照最左優先的方式進行索引的匹配，否則就會導致索引失效。
在 WHERE 子句中，如果在 OR 前的條件列是索引列，而在 OR 後的條件列不是索引列，那麼索引會失效。

FMEA失效的原因是什麼？
2023-10-20
我面試幾乎必問：你設計索引的原則是什麼？怎麼避免索引失效？
2021-05-10
面試索引
面試官：你知道哪些事務失效的場景？
2020-04-19
面試
索引失效場景
2020-09-26
索引
mysql索引失效的情況
2023-09-25
MySql索引
探索MySQL的InnoDB索引失效
2024-10-06
MySql索引
MySql ORDER BY索引是否失效
2024-11-20
MySql索引
[資料庫]索引失效
2024-07-05
資料庫索引
Mysql索引失效問題demo
2024-12-09
MySql索引
全域性索引失效帶來的幾個測試場景
2023-10-07
索引
為什麼MySQL字串不加引號索引失效？《死磕MySQL系列十一》
2021-11-17
MySql字串索引
MySQL學習筆記：索引失效
2020-09-22
MySql筆記索引
聊一聊MySQL索引失效的問題
2022-01-24
MySql索引
Mysql 會導致索引失效的情況
2021-12-08
MySql索引
MySQL系列：索引失效場景總結
2024-03-19
MySql索引
MySQL索引失效行鎖變表鎖
2020-10-03
MySql索引
MySQL索引失效之隱式轉換
2022-01-08
MySql索引
MYSQL索引失效的各種情況小結
2021-06-04
MySql索引
oracle交換分割槽所引起的索引失效問題探究測試
2021-03-11
Oracle索引
【DB筆試面試352】在Oracle資料庫中，哪些操作會導致索引失效？--UNUSABLE INDEXES
2018-04-12
筆試面試Oracle資料庫索引Index
建立索引後，速度變快原因?以及索引失效總結
2018-10-11
索引
Textrimming 失效怎麼辦?
2024-06-01
面試時，面試官到底在考察什麼？
2019-02-19
面試
面試官：聊一聊索引吧
2021-09-14
面試索引
面試官問我MySQL索引，我
2021-09-01
面試MySql索引
簡單介紹MySQL索引失效的幾種情況
2020-10-14
MySql索引
盤一盤常見的6種索引失效情況
2022-02-23
索引
面試官：Dubbo是什麼，他有什麼特性？
2022-06-01
面試
面試官：ZAB協議是什麼？
2022-04-09
面試協議
面試官！讓我們聊聊正則
2018-08-02
面試
面試官：簡單聊聊 Go 逃逸分析？
2022-04-15
面試Go
我去，為什麼最左字首原則失效了？
2020-05-20
聊聊spring事務失效的12種場景，太坑了
2021-09-04
Spring
索引失效底層原理分析，這麼多年終於有人講清楚了
2020-10-16
索引
MySQL 使用 like "%x"，索引一定會失效嗎？
2022-01-25
MySql索引
面試官: 你為什麼使用前端框架?
2018-06-06
面試前端框架
面試官：什麼是二叉樹
2020-04-14
面試二叉樹
面試官：為什麼 Promise 比setTimeout() 快？
2021-12-13
面試Promise