MySQL優化之索引解析

淚夢紅塵blog發表於2022-03-15

原文網址 : https://www.cnblogs.com/lmhcblog/p/16009320.html

MySql優化索引

索引的本質

MySQL索引或者說其他關係型資料庫的索引的本質就只有一句話，以空間換時間。

索引的作用

索引關係型資料庫為了加速對錶中行資料檢索的（磁碟儲存的）資料結構

索引的分類

資料結構上面的分類

HASH 索引
1. 等值匹配效率高
2. 不支援範圍查詢
樹形索引
1. 二叉樹，遞迴二分查詢法，左小右大
2. 平衡二叉樹，二叉樹到平衡二叉樹，主要原因是左旋右旋
  1. 缺點1，IO次數過多
  2. 缺點2，IO利用率不高，IO飽和度
3. 多路平衡查詢樹（B-Tree）
  1. 特點，大大的減少了樹的高度
4. B+樹
  1. 特點，採用左閉合的比較方式
  2. 根節點支節點沒有資料區，只有葉子結點才包含資料區（說白了就是即便在根節點和子節點已經定位到，因為沒有資料區的原因也不會停留，會一直找到葉子結點為止。）
    - 當我們搜尋13這條資料時，在根節點和子節點都能定位，但是一直會找到葉子結點。
二叉樹平衡二叉樹，B樹對比

如圖顯示如果是自增主鍵情況下：

二叉樹顯然不適合做關係型資料庫索引（和全表掃描沒什麼區別）。

平衡二叉樹呢，雖然解決了這種情況，但是同樣會導致這棵樹，又瘦又高，這同樣會造成上文所提到查詢IO次數過多以及IO利用率不高。

B樹呢，顯然已經解決了這兩個問題，所以下文來解釋，為什麼在這種情況下MySQL還用了B+樹，又做了那些增強。

二叉樹|平衡二叉樹|B樹對比

B樹和B+樹比較

B+樹在B樹上面的優化
1. IO效率更高（B樹每個節點都會保留資料區，而B+樹則不會，假設我們查詢一條資料要遍歷三層，那麼顯然B+樹查詢中IO消耗更小）
2. 範圍查詢效率更高（如圖，B+樹已經形成了一個天然連結串列形式，只需要根據最結尾的鏈式結構查詢）
3. 基於索引的資料掃描效率更高。

索引型別的分類

索引型別可分為兩類:
1. 主鍵索引
2. 輔佐索引(二級索引)
  1. 唯一性索引
  2. 複合索引
  3. 普通索引
  4. 覆蓋索引
主鍵索引相對來說效能是最好的，但是對於SQL優化，其實大多時候我們都在輔佐索引上面做一些改進和補充。

B+樹在儲存引擎層面落地

我們建立兩個表分別為test_innodb（採用InnoDB作為儲存引擎）test_myisam（採用MyISAM作為儲存引擎）下圖是兩張表磁碟落地的相關檔案，這兩個儲存引擎在B+樹磁碟落地式截然不同的。

B+樹在MyISAM落地

*.frm檔案是表格骨架檔案比如這個表中的id欄位name欄位是什麼型別的儲存在這裡
*.MYD（D=data）則儲存資料
*.MYI （I=index）則儲存索引

B+樹在MyISAM落地

比如現在執行如下sql語句，那麼在MyISAM中他就是先在test_myisam.MYI中查詢到103然後拿到0x194281這個地址然後再去test_myisam.MYD中找到這個資料返回。
```
SELECT id,name from test_myisam where id =103
```
如果test_myisam表中，id為主鍵索引，name也是一個索引，那麼在test_myisam.MYI中則會有兩個平級的B+樹，這也導致MyISAM引擎中主鍵索引和二級索引是沒有主次之分的，是平級關係。因為這種機制在MyISAM引擎中，有可能使用多個索引，在InnoDB中則不會出現這種情況。

B+樹在InnoDB落地

InnoDB

InnoDB不像MyISAM來獨立一個MYD 檔案來儲存資料，它的資料直接儲存在葉子結點關鍵字對應的資料區在這儲存這一個id列所有行的詳細記錄。
InnoDB 主鍵索引和輔助索引關係

我們現在執行如下SQL語句,他會先去找輔助索引，然後找到輔助索引下101的主鍵，再去回表（二次掃描）根據主鍵索引查詢103這條資料將其返回。
```
SELECT id,name from test_myisam where name ='zhangsan'
```
這裡就有一個問題了，為什麼不像MyISAM在輔助索引下直接記錄磁碟地址，而是要多此一舉再去回表掃描主鍵索引，這個問題在下面相關面試題中回答，記一下這個問題是這裡來的。

相關面試題

為什麼MySQL選擇B+樹作為索引結構

這個就不說了，上文應該講清楚了。
B+樹在MyISAM和InnoDB落地區別。

這個可以總結一下，MyISAM落地資料儲存會有三個型別檔案，.frm檔案是表骨架檔案，.MYD（D=data）則儲存資料，.MYI （I=index）則儲存索引，MyISAM引擎中主鍵索引和二級索引平級關係，在MyISAM引擎中，有可能使用多個索引，InnoDB則相反，主鍵索引和二級索有嚴格的主次之分在InnoDB一條語句只能用一個索引要麼不用。
如何判斷一條sql語句是否使用了索引。

可以通過執行計劃來判斷可以在sql語句前explain/ desc

set global optimizer_trace='enabled=on' 開啟執行計劃開關他將會把每一條查詢sql執行計劃記錄在information_schema 庫中OPTIMIZER_TRACE表中
為什麼主鍵索引最好選擇自增列？

自增列，資料插入時整個索引樹是隻有右邊在增加的，相對來說索引樹的變動更小。
為什麼經常變動的列不建議使用索引？

和上一個問題原因一樣，當一個索引經常發生變化，那麼就意味這，這個縮印樹也要經常發生變化。4
為什麼說重複度高的列，不建議建立索引？

這個原因是因為離散性，比如說，一張一百萬資料的表，其中一個欄位代表性別，0代表男1代表女，把這欄位加了索引，那麼在索引樹上，將會有大量的重複資料。而我們常見的索引建立一般都是驅動型的。其目的是，儘可能的刪減資料的查詢範圍，這個顯然是不匹配的。
什麼是聯合索引

聯合索引是一個包含了多個功效的索引，他只是一個索引而不是多個，

其次，單列索引是一種特殊的聯合索引

聯合索引的創立要遵循最左前置原則（最常用列>離散度>佔用空間小）
什麼是覆蓋索引

通過索引項資訊可直接返回所需要查詢的索引列，該索引被稱之為覆蓋索引，說白了就是不需要做回表操作，可以從二級索引中直接取到所需資料。
什麼是ICP機制

索引下推，簡單點來說就是，在sql執行過程中，面對where多條件過濾時，通過一個索引，完成資料搜尋和過濾條件其，特點能減少io操作。
在InnoDB表中不可能沒有主鍵對還是不對原因是什麼？
1. 首先這句話是對的，但是情況有三種:
  1. 就是在你手動顯式指定這一個欄位為主鍵時候，會以這一個欄位為聚集索引。
  2. 在沒有顯式指定主鍵時候有兩種情況：
    1. 他會尋找第一個UK（unique key）作為主鍵索引組織索引編排。
    2. 如果既沒有指定主鍵也沒有UK的情況下，此時會以rowId（在InnoDB表中每一個記錄都會有一個隱藏（6byte）的rowId）為聚集索引。
什麼是回表操作

在InnoDB 中基於輔助索引查詢的內容，從輔助索引中無法直接獲取，需要基於主鍵索引的二次掃描的操作叫做回表操作。
為什麼在InnoDB 中輔助索引葉子結點資料區記錄的是主鍵索引的值而不是像MyISAM中去記錄磁碟地址。
1. 這個原因其實很簡單，因為主鍵索引的資料結構是會經常發生變化的，如果在輔助索引資料區記錄磁碟地址，那麼假設我們有10個輔助索引，當我們主鍵索引結構發生變化後，還要一個個去通知輔助索引，且主鍵索引結構是經常發生變化的，增刪都有可能影響他的資料結構。
  版權歸屬：淚夢紅塵
  本文連結： https://www.bss2.com/archives/mysql-opt-index

MySQL調優之索引優化
2021-11-09
MySql索引優化
Mysql索引優化之索引的分類
2019-07-04
MySql索引優化
MySQL效能優化之索引設計
2022-03-08
MySql優化索引
MySQL索引優化
2021-01-05
MySql索引優化
mysql優化索引
2020-12-23
MySql優化索引
MySQL優化學習筆記之索引
2018-10-22
MySql優化筆記索引
【MySQL】三、效能優化之覆蓋索引
2018-10-11
MySql優化索引
MySQL優化之覆蓋索引的使用
2019-08-22
MySql優化索引
Mysql索引優化（一）
2020-12-02
MySql索引優化
MySQL 優化之 index_merge （索引合併）
2018-05-11
MySql優化Index索引
《MySQL慢查詢優化》之SQL語句及索引優化
2020-12-06
MySql優化索引
MySQL 筆記 - 索引優化
2018-08-12
MySql筆記索引優化
MySQL——索引優化實戰
2018-08-08
MySql索引優化
MySQL 字串索引優化方案
2020-07-01
MySql字串索引優化
MySQL 索引原理以及優化
2019-06-03
MySql索引優化
mysql索引原理及優化
2021-06-20
MySql索引優化
mysql索引的使用和優化
2018-10-25
MySql索引優化
MySQL索引與查詢優化
2019-04-13
MySql索引優化
MySQL 索引使用策略及優化
2019-08-07
MySql索引優化
mysql優化篇（基於索引）
2020-10-22
MySql優化索引
MySQL函式索引及優化
2020-07-04
MySql函式索引優化
MySQL-效能優化-索引和查詢優化
2018-06-03
MySql優化索引
淺談MySQL的B樹索引與索引優化
2018-03-26
MySql索引優化
MySQL 效能優化——B+Tree 索引
2019-03-16
MySql優化索引
MySQL-索引優化全攻略
2018-12-07
MySql索引優化
「MySQL」高效能索引優化策略
2019-03-02
MySql索引優化
MySQL 索引優化 Using where, Using filesort
2020-10-26
MySql索引優化
mysql索引優化和TCP協議
2020-12-31
MySql索引優化TCP協議
Java高階程式設計——MySQL索引實現及優化原理解析
2019-03-03
Java程式設計MySql索引優化
效能調優-Mysql索引資料結構詳解與索引優化
2021-11-04
MySql索引資料結構優化
【MySQL】MySQL的執行計劃及索引優化
2019-02-25
MySql索引優化
Mysql多列索引建立與優化.md
2020-11-08
MySql索引優化
Mysql效能優化：如何給字串加索引？
2020-04-02
MySql優化字串索引
MySQL 索引及查詢優化總結
2019-01-02
MySql索引優化
mysql索引之字首索引
2019-08-20
MySql索引
理解索引：索引優化
2018-06-04
索引優化
SQL優化案例-分割槽索引之無字首索引（六）
2018-08-21
SQL優化索引
Oracle優化案例-分割槽索引之無字首索引（六）
2018-08-06
Oracle優化索引

MySQL優化之索引解析

索引的本質

索引的作用

索引的分類

資料結構上面的分類

二叉樹平衡二叉樹，B樹對比

B樹和B+樹比較

索引型別的分類

B+樹在儲存引擎層面落地

B+樹在MyISAM落地

B+樹在InnoDB落地

相關面試題

相關文章