【恩墨學院】如何理解並正確使用MySql索引

恩墨學院發表於2017-11-09

如何理解並正確使用MySql索引

 

索引是儲存引擎用於快速查詢記錄的一種資料結構,透過合理的使用資料庫索引可以大大提高系統的訪問效能,本文主要介紹在MySql資料庫中索引型別,以及如何建立出更加合理且高效的索引技巧。

1、概述

索引是儲存引擎用於快速查詢記錄的一種資料結構,透過合理的使用資料庫索引可以大大提高系統的訪問效能,接下來主要介紹在MySql資料庫中索引型別,以及如何建立出更加合理且高效的索引技巧。

注:這裡主要針對的是InnoDB儲存引擎的B+Tree索引資料結構

2、索引的優點

  • 大大減輕了伺服器需要掃描的資料量,從而提高了資料的檢索速度
  • 幫助伺服器避免排序和臨時表
  • 可以將隨機I/O變為順序I/O

3、索引的建立

3.1 主鍵索引

恩墨學院-專注oracle大資料培訓

3.2 唯一索引

恩墨學院-專注oracle大資料培訓

3.3 普通索引

恩墨學院-專注oracle大資料培訓

3.4 全文索引

恩墨學院-專注oracle大資料培訓

3.5 組合索引

恩墨學院-專注oracle大資料培訓

4B+Tree的索引規則

建立一個測試的使用者表

恩墨學院-專注oracle大資料培訓

建立一個組合索引: ALTER TABLE user_test ADD INDEX idx_user(user_name , city , age);

4.1 索引有效的查詢

4.1.1 全值匹配

全值匹配指的是和索引中的所有列進行匹配,如:以上面建立的索引為例,在where條件後可同時查詢(user_namecityage)為條件的資料。

注:與where後查詢條件的順序無關,這裡是很多同學容易誤解的一個地方  

恩墨學院-專注oracle大資料培訓

4.1.2 匹配最左字首

匹配最左字首是指優先匹配最左索引列,如:上面建立的索引可用於查詢條件為:(user_name )(user_name, city)(user_name , city , age)

注:滿足最左字首查詢條件的順序與索引列的順序無關,如:(city, user_name)(age, city, user_name)

4.1.3 匹配列字首

指匹配列值的開頭部分,如:查詢使用者名稱以feinik開頭的所有使用者

恩墨學院-專注oracle大資料培訓

4.1.4 匹配範圍值

如:查詢使用者名稱以feinik開頭的所有使用者,這裡使用了索引的第一列

恩墨學院-專注oracle大資料培訓

4.2 索引的限制

1)where查詢條件中不包含索引列中的最左索引列,則無法使用到索引查詢,如:

恩墨學院-專注oracle大資料培訓

恩墨學院-專注oracle大資料培訓

恩墨學院-專注oracle大資料培訓

2)、即使where的查詢條件是最左索引列,也無法使用索引查詢使用者名稱以feinik結尾的使用者

恩墨學院-專注oracle大資料培訓

3)、如果where查詢條件中有某個列的範圍查詢,則其右邊的所有列都無法使用索引最佳化查詢,如:

恩墨學院-專注oracle大資料培訓

5、高效的索引策略

5.1 索引列

索引列不能是表示式的一部分,也不能作為函式的引數,否則無法使用索引查詢。

恩墨學院-專注oracle大資料培訓

5.2 字首索引

有時候需要索引很長的字元列,這會增加索引的儲存空間以及降低索引的效率,一種策略是可以使用雜湊索引,還有一種就是可以使用字首索引,字首索引是選擇字元列的前n個字元作為索引,這樣可以大大節約索引空間,從而提高索引效率。

5.2.1 字首索引的選擇性

字首索引要選擇足夠長的字首以保證高的選擇性,同時又不能太長,我們可以透過以下方式來計算出合適的字首索引的選擇長度值:

(1)

恩墨學院-專注oracle大資料培訓

注:透過以上方式來計算出字首索引的選擇性比值,比值越高說明索引的效率也就越高效。

(2)

恩墨學院-專注oracle大資料培訓

注:透過以上語句逐步找到最接近於(1)中的字首索引的選擇性比值,那麼就可以使用對應的字元擷取長度來做字首索引了

5.2.2 字首索引的建立 

恩墨學院-專注oracle大資料培訓

5.2.3 使用字首索引的注意點

字首索引是一種能使索引更小,更快的有效辦法,但是MySql無法使用字首索引做ORDER BY GROUP BY以及使用字首索引做覆蓋掃描。

5.3 選擇合適的索引列順序

在組合索引的建立中索引列的順序非常重要,正確的索引順序依賴於使用該索引的查詢方式,對於組合索引的索引順序可以透過經驗法則來幫助我們完成:將選擇性最高的列放到索引最前列,該法則與字首索引的選擇性方法一致,但並不是說所有的組合索引的順序都使用該法則就能確定,還需要根據具體的查詢場景來確定具體的索引順序。

5.4 聚集索引與非聚集索引

1)、聚集索引

聚集索引決定資料在物理磁碟上的物理排序,一個表只能有一個聚集索引,如果定義了主鍵,那麼InnoDB會透過主鍵來聚集資料,如果沒有定義主鍵,InnoDB會選擇一個唯一的非空索引代替,如果沒有唯一的非空索引,InnoDB會隱式定義一個主鍵來作為聚集索引。

聚集索引可以很大程度的提高訪問速度,因為聚集索引將索引和行資料儲存在了同一個B-Tree中,所以找到了索引也就相應的找到了對應的行資料,但在使用聚集索引的時候需注意避免隨機的聚集索引(一般指主鍵值不連續,且分佈範圍不均勻),如使用UUID來作為聚集索引效能會很差,因為UUID值的不連續會導致增加很多的索引碎片和隨機I/O,最終導致查詢的效能急劇下降。

2)、非聚集索引

與聚集索引不同的是非聚集索引並不決定資料在磁碟上的物理排序,且在B-Tree中包含索引但不包含行資料,行資料只是透過儲存在B-Tree中的索引對應的指標來指向行資料,如:上面在(user_namecity, age)上建立的索引就是非聚集索引。

5.5 覆蓋索引

如果一個索引(如:組合索引)中包含所有要查詢的欄位的值,那麼就稱之為覆蓋索引,如: 

恩墨學院-專注oracle大資料培訓

因為要查詢的欄位(user_name, city, age)都包含在組合索引的索引列中,所以就使用了覆蓋索引查詢,檢視是否使用了覆蓋索引可以透過執行計劃中的Extra中的值為Using index則證明使用了覆蓋索引,覆蓋索引可以極大的提高訪問效能。

5.6 如何使用索引來排序

在排序操作中如果能使用到索引來排序,那麼可以極大的提高排序的速度,要使用索引來排序需要滿足以下兩點即可。

1)ORDER BY子句後的列順序要與組合索引的列順序一致,且所有排序列的排序方向(正序/倒序)需一致

2)、所查詢的欄位值需要包含在索引列中,及滿足覆蓋索引

透過例子來具體分析

user_test表上建立一個組合索引

恩墨學院-專注oracle大資料培訓

可以使用到索引排序的案例

恩墨學院-專注oracle大資料培訓

注:第4點比較特殊一點,如果where查詢條件為索引列的第一列,且為常量條件,那麼也可以使用到索引

無法使用索引排序的案例

1)sex不在索引列中

恩墨學院-專注oracle大資料培訓

2)、排序列的方向不一致

恩墨學院-專注oracle大資料培訓

3)、所要查詢的欄位列sex沒有包含在索引列中

恩墨學院-專注oracle大資料培訓

4)where查詢條件後的user_name為範圍查詢,所以無法使用到索引的其他列

恩墨學院-專注oracle大資料培訓

5)、多表連線查詢時,只有當ORDER BY後的排序欄位都是第一個表中的索引列(需要滿足以上索引排序的兩個規則)時,方可使用索引排序。如:再建立一個使用者的擴充套件表user_test_ext,並建立uid的索引。

恩墨學院-專注oracle大資料培訓

走索引排序

恩墨學院-專注oracle大資料培訓

不走索引排序

恩墨學院-專注oracle大資料培訓

6、總結

本文主要講了B+Tree樹結構的索引規則,不同索引的建立,以及如何正確的建立出高效的索引技巧來儘可能的提高查詢速度,當然了關於索引的使用技巧不單單隻有這些,關於索引的更多技巧還需平時不斷的積累相關經驗。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28530558/viewspace-2147046/,如需轉載,請註明出處,否則將追究法律責任。

相關文章