Mysql效能優化：如何給字串加索引？

不才陳某發表於2020-04-02

原文網址 : http://juejin.im/post/5e859f44f265da47bc58ff40

導讀

現代大部分的登入系統都支援郵箱、手機號碼登入兩種方式，那麼如何在郵箱或者手機號碼這個字串上建立索引才能保證效能最佳呢？
今天這篇文章就來探討一下在Mysql中如何給一個字串加索引才能達到效能最佳。
本文首發於作者的微信公眾號【碼猿技術專欄】Mysql效能優化：如何給字串加索引？,原創不易，喜歡的讀者關注一下，謝謝！！！
陳某將會從什麼是字首索引、字首索引和普通索引的比較、如何建麗最佳效能的字首索引、字首索引對覆蓋索引的影響這幾段來講。

字首索引

顧名思義，對於列值較長，比如BLOB、TEXT、VARCHAR，就 "必須" 使用字首索引，即將值的前一部分作為索引。因為索引的儲存也是需要空間的，同樣索引太長維護起來也比較困難。
比如我們給User表中的郵箱新增字首索引，如下:

 alter table user add index index1(email(7));
複製程式碼

上述語句將email的前7個字元作為索引。

字首索引和普通索引比較

我們分別將email的全部作為索引和前7個字元作為索引來看看在效能上有什麼差異。建立索引的語句如下：

alter table user add index index1(email);

alter table user add index index2(email(7));
複製程式碼

假設有user表中有這樣幾條資料(id,name,email)：(1,"陳某","chenmou1993@xxx")、(2,"張某","chenmou1994@xxx")、(3,"李某","chenmou1995@xxx")、(4,"王某","chenmou1996@xxx")。
對應於index1和index2的索引樹如下兩張圖：

如果執行下面的查詢語句，Mysql如何利用索引來查詢呢？

select * from user where email="chenmou1995@xxx";
複製程式碼

【1】普通索引的執行過程

從index1索引樹找到滿足索引值是chenmou1995@xxx的這條記錄，取得id=2的值；
到主鍵上查到主鍵值是id=2的行，判斷email的值是正確的，將這行記錄加入結果集；
取index1索引樹上剛剛查到的位置的下一條記錄，發現已經不滿足email=chenmou1995@xxx的條件了，迴圈結束。

這個過程中，只需要回主鍵索引取一次資料，所以系統認為只掃描了一行。

【2】字首索引的執行過程

從index2索引樹找到滿足索引值是chenmou的記錄，找到的第一個是id=1；
到主鍵上查到主鍵值是id=1的行，判斷出email的值不是chenmou1995@xxx，這行記錄丟棄；
取index2上剛剛查到的位置的下一條記錄，發現仍然是chenmou，取出id=2，再到ID索引上取整行然後判斷，這次值對了，將這行記錄加入結果集；
重複上一步，直到在idxe2上取到的值不是chenmou時，迴圈結束。

在這個過程中，要回主鍵索引取4次資料，也就是掃描了4行。

通過以上查詢的對比，很容易就可以發現，使用字首索引後，可能會導致查詢語句讀資料的次數變多。
但是對於這個查詢語句來說，如果建立的字首索引的長度為13呢？那麼滿足chenmou1995的記錄只有一個，這樣就可以直接定位到id=2，此時不但空間縮小了，掃描的行數也減少了。
於是結論就來了：使用字首索引，只要定義好長度，就可以做到既節省空間，又不用額外增加太多的查詢成本。
那麼如何建立正確的字首索引才能達到最佳的效能呢？接著往下看................

如何建立最佳效能的字首索引

通過上述的比較，可以得出一個結論，建立字首索引的區分度越高越好，意味著重複的鍵值越少。
那麼如何統計區分度，其實很簡單，只需要判斷資料庫中重複的次數即可。sql如下：

select 
  count(distinct left(email,4)）as L4,
  count(distinct left(email,5)）as L5,
  count(distinct left(email,6)）as L6,
  count(distinct left(email,7)）as L7,
from user;
複製程式碼

但是如果對於使用字首區分度不太好的情況，比如，我們國家的身份證號，一共18位，其中前6位是地址碼，所以同一個縣的人的身份證號前6位一般會是相同的。這時候如果對身份證號做長度為6的字首索引的話，這個索引的區分度就非常低了。
按照我們前面說的方法，可能你需要建立長度為12以上的字首索引，才能夠滿足區分度要求。
但是，索引選取的越長，佔用的磁碟空間就越大，相同的資料頁能放下的索引值就越少，搜尋的效率也就會越低。
那麼，如果我們能夠確定業務需求裡面只有按照身份證進行等值查詢的需求，還有沒有別的處理方法呢？這種方法，既可以佔用更小的空間，也能達到相同的查詢效率。現在簡單的介紹一種解決此種問題的方式，當然方法肯定不止一種，如下：

【1】倒序儲存

如果你儲存身份證號的時候把它倒過來存，每次查詢的時候，你可以這麼寫：

 select field_list from t where id_card = reverse('輸入的身份證號');
複製程式碼

由於身份證號的最後6位沒有地址碼這樣的重複邏輯，所以最後這6位很可能就提供了足夠的區分度。當然了，實踐中你不要忘記使用count(distinct)方法去做個驗證。

字首索引對覆蓋索引的影響

字首索引會導致覆蓋索引失效，查詢語句如下：

select id,name from user where email="chenmou1995@xxx";
複製程式碼

由於使用了字首索引，因此必須會回表驗證查詢到的時候正確，此處使用了覆蓋索引也是無效的。
也就是說，使用字首索引就用不上覆蓋索引對查詢效能的優化了，這也是你在選擇是否使用字首索引時需要考慮的一個因素。

總結

如何給字串加索引是一個需要考量的問題，陳某在這裡給出如下的建議：

如果字串長度很短，建議直接用全部作為索引。
使用字首索引注意分析區分度，區分度越高越好。
使用字首索引需要考慮覆蓋索引失效的問題。

MySQL 字串索引優化方案
2020-07-01
MySql字串索引優化
MySQL效能優化 - 別再只會說加索引了
2022-05-02
MySql優化索引
怎麼給字串欄位加索引？
2022-03-05
字串索引
MySQL-效能優化-索引和查詢優化
2018-06-03
MySql優化索引
MySQL 效能優化——B+Tree 索引
2019-03-16
MySql優化索引
「MySQL」高效能索引優化策略
2019-03-02
MySql索引優化
MySQL效能優化之索引設計
2022-03-08
MySql優化索引
【MySQL】三、效能優化之覆蓋索引
2018-10-11
MySql優化索引
效能調優-Mysql索引資料結構詳解與索引優化
2021-11-04
MySql索引資料結構優化
MySQL索引優化
2021-01-05
MySql索引優化
mysql優化索引
2020-12-23
MySql優化索引
Mysql索引優化（一）
2020-12-02
MySql索引優化
效能優化：索引下推
2020-11-18
優化索引
MySQL調優之索引優化
2021-11-09
MySql索引優化
mysql效能優化
2020-08-01
MySql優化
MySQL——效能優化
2020-11-18
MySql優化
MySQL 筆記 - 索引優化
2018-08-12
MySql筆記索引優化
MySQL——索引優化實戰
2018-08-08
MySql索引優化
MySQL 索引原理以及優化
2019-06-03
MySql索引優化
MySQL優化之索引解析
2022-03-15
MySql優化索引
mysql索引原理及優化
2021-06-20
MySql索引優化
Mysql索引優化之索引的分類
2019-07-04
MySql索引優化
MySQL 字串索引和字首索引
2024-11-06
MySql字串索引
String字串效能優化的探究
2020-10-28
字串優化
MySQL 效能優化方案
2019-06-15
MySql優化
MySQL系列：效能優化
2018-03-29
MySql優化
Mysql效能優化一
2020-12-11
MySql優化
mysql索引的使用和優化
2018-10-25
MySql索引優化
MySQL索引與查詢優化
2019-04-13
MySql索引優化
MySQL 索引使用策略及優化
2019-08-07
MySql索引優化
mysql優化篇（基於索引）
2020-10-22
MySql優化索引
MySQL函式索引及優化
2020-07-04
MySql函式索引優化
字串可以這樣加索引，你知嗎？《死磕MySQL系列七》
2021-11-08
字串索引MySql
淺談MySQL的B樹索引與索引優化
2018-03-26
MySql索引優化
資料庫效能優化-索引與sql相關優化
2018-08-01
資料庫優化索引SQL
MySQL-索引優化全攻略
2018-12-07
MySql索引優化
MySQL 索引優化 Using where, Using filesort
2020-10-26
MySql索引優化
mysql索引優化和TCP協議
2020-12-31
MySql索引優化TCP協議

Mysql效能優化：如何給字串加索引？

導讀

字首索引

字首索引和普通索引比較

如何建立最佳效能的字首索引

字首索引對覆蓋索引的影響

總結

相關文章