一篇文章搞定 MySQL 索引優化

列文發表於2019-04-22

原文網址 : https://juejin.im/post/5cbd7610f265da03587bfc19

MySql索引優化

本文主要討論MySQL索引的部分知識。將會從MySQL索引基礎、索引優化實戰和資料庫索引背後的資料結構三部分相關內容，下面一一展開（本文圖片可點開放大）。

一、MySQL索引基礎

首先，我們將從索引基礎開始介紹一下什麼是索引，分析索引的幾種型別，並探討一下如何建立索引以及索引設計的基本原則。

此部分用於測試索引建立的user表的結構如下：

1. 什麼是索引？

“索引（在MySQL中也叫“鍵key”）是儲存引擎快速找到記錄的一種資料結構。”

——《高效能MySQL》

我們需要知道索引其實是一種資料結構，其功能是幫助我們快速匹配查詢到需要的資料行，是資料庫效能優化最常用的工具之一。其作用相當於超市裡的導購員、書本里的目錄。

2. 索引型別

可以使用SHOW INDEX FROM table_name;檢視索引詳情：

主鍵索引 PRIMARY KEY：它是一種特殊的唯一索引，不允許有空值。一般是在建表的時候同時建立主鍵索引。注意：一個表只能有一個主鍵。

唯一索引 UNIQUE：唯一索引列的值必須唯一，但允許有空值。如果是組合索引，則列值的組合必須唯一。可以通過ALTER TABLE table_name ADD UNIQUE (column);建立唯一索引：

可以通過ALTER TABLE table_name ADD UNIQUE (column1,column2);建立唯一組合索引：

普通索引 INDEX：這是最基本的索引，它沒有任何限制。可以通過ALTER TABLE table_name ADD INDEX index_name (column);建立普通索引：

組合索引 INDEX：即一個索引包含多個列，多用於避免回表查詢。可以通過ALTER TABLE table_name ADD INDEX index_name(column1,column2, column3);建立組合索引：

全文索引 FULLTEXT：也稱全文檢索，是目前搜尋引擎使用的一種關鍵技術。可以通過ALTER TABLE table_name ADD FULLTEXT (column);建立全文索引：

索引一經建立不能修改，如果要修改索引，只能刪除重建。可以使用

DROP INDEX index_name ON table_name;刪除索引。

3、索引設計的原則

1）適合索引的列是出現在where子句中的列，或者連線子句中指定的列；

2）基數較小的類，索引效果較差，沒有必要在此列建立索引；

3）使用短索引，如果對長字串列進行索引，應該指定一個字首長度，這樣能夠節省大量索引空間；

4）不要過度索引。索引需要額外的磁碟空間，並降低寫操作的效能。在修改表內容的時候，索引會進行更新甚至重構，索引列越多，這個時間就會越長。所以只保持需要的索引有利於查詢即可。

二、MySQL索引優化實戰

上面我們介紹了索引的基本內容，這部分我們介紹索引優化實戰。在介紹索引優化實戰之前，首先要介紹兩個與索引相關的重要概念，這兩個概念對於索引優化至關重要。

此部分用於測試的user表結構：

1、索引相關的重要概念

基數：單個列唯一鍵（distict_keys）的數量叫做基數。

SELECT COUNT(DISTINCT name),COUNT(DISTINCT gender) FROM user;

user表的總行數是5，gender列的基數是2，說明gender列裡面有大量重複值，name列的基數等於總行數，說明name列沒有重複值，相當於主鍵。

返回資料的比例：user表中共有5條資料：

SELECT * FROM user;

查詢滿足性別為0（男）的記錄數：

那麼返回記錄的比例數是：

同理，查詢name為'swj'的記錄數：

返回記錄的比例數是：

現在問題來了，假設name、gender列都有索引，那麼SELECT * FROM user WHERE gender = 0; SELECT * FROM user WHERE name = 'swj';都能命中索引嗎？

user表的索引詳情：

SELECT * FROM user WHERE gender = 0;沒有命中索引，注意filtered的值就是上面我們計算的返回記錄的比例數。

SELECT * FROM user WHERE name = 'swj';命中了索引index_name，因為走索引直接就能找到要查詢的記錄，所以filtered的值為100。

因此，返回表中30%內的資料會走索引，返回超過30%資料就使用全表掃描。當然這個結論太絕對了，也並不是絕對的30%，只是一個大概的範圍。

回表：當對一個列建立索引之後，索引會包含該列的鍵值及鍵值對應行所在的rowid。通過索引中記錄的rowid訪問表中的資料就叫回表。回表次數太多會嚴重影響SQL效能，如果回表次數太多，就不應該走索引掃描，應該直接走全表掃描。

EXPLAIN命令結果中的Using Index意味著不會回表，通過索引就可以獲得主要的資料。Using Where則意味著需要回表取資料。

2. 索引優化實戰

有些時候雖然資料庫有索引，但是並不被優化器選擇使用。我們可以通過SHOW STATUS LIKE 'Handler_read%';檢視索引的使用情況：

Handler_read_key：如果索引正在工作，Handler_read_key的值將很高。

Handler_read_rnd_next：資料檔案中讀取下一行的請求數，如果正在進行大量的表掃描，值將較高，則說明索引利用不理想。

索引優化規則：

1）如果MySQL估計使用索引比全表掃描還慢，則不會使用索引。

返回資料的比例是重要的指標，比例越低越容易命中索引。記住這個範圍值——30%，後面所講的內容都是建立在返回資料的比例在30%以內的基礎上。

2）前導模糊查詢不能命中索引。

name列建立普通索引：

前導模糊查詢不能命中索引：

EXPLAIN SELECT * FROM user WHERE name LIKE '%s%';

非前導模糊查詢則可以使用索引，可優化為使用非前導模糊查詢：

EXPLAIN SELECT * FROM user WHERE name LIKE 's%';

3）資料型別出現隱式轉換的時候不會命中索引，特別是當列型別是字串，一定要將字元常量值用引號引起來。

EXPLAIN SELECT * FROM user WHERE name=1;

EXPLAIN SELECT * FROM user WHERE name='1';

4）複合索引的情況下，查詢條件不包含索引列最左邊部分（不滿足最左原則），不會命中符合索引。

name,age,status列建立複合索引：

ALTER TABLE user ADD INDEX index_name (name,age,status);

user表索引詳情：

SHOW INDEX FROM user;

根據最左原則，可以命中複合索引index_name：

EXPLAIN SELECT * FROM user WHERE name='swj' AND status=1;

注意，最左原則並不是說是查詢條件的順序：

EXPLAIN SELECT * FROM user WHERE status=1 AND name='swj';

而是查詢條件中是否包含索引最左列欄位：

EXPLAIN SELECT * FROM user WHERE status=2 ;

5）union、in、or都能夠命中索引，建議使用in。

union:

EXPLAIN SELECT*FROM user WHERE status=1

UNION ALL

SELECT*FROM user WHERE status = 2;

in:

EXPLAIN SELECT * FROM user WHERE status IN (1,2);

or:

EXPLAIN SELECT*FROM user WHERE status=1OR status=2;

查詢的CPU消耗：or>in>union。

6）用or分割開的條件，如果or前的條件中列有索引，而後面的列中沒有索引，那麼涉及到的索引都不會被用到。

EXPLAIN SELECT * FROM payment WHERE customer_id = 203 OR amount = 3.96;

因為or後面的條件列中沒有索引，那麼後面的查詢肯定要走全表掃描，在存在全表掃描的情況下，就沒有必要多一次索引掃描增加IO訪問。

7）負向條件查詢不能使用索引，可以優化為in查詢。

負向條件有：!=、<>、not in、not exists、not like等。

status列建立索引：

ALTER TABLE user ADD INDEX index_status (status);

user表索引詳情：

SHOW INDEX FROM user;

負向條件不能命中快取：

EXPLAIN SELECT * FROM user WHERE status !=1 AND status != 2;

可以優化為in查詢，但是前提是區分度要高，返回資料的比例在30%以內：

EXPLAIN SELECT * FROM user WHERE status IN (0,3,4);

8）範圍條件查詢可以命中索引。範圍條件有：<、<=、>、>=、between等。

status,age列分別建立索引：

ALTER TABLE user ADD INDEX index_status (status);

ALTER TABLE user ADD INDEX index_age (age);

user表索引詳情：

SHOW INDEX FROM user;

範圍條件查詢可以命中索引：

EXPLAIN SELECT * FROM user WHERE status>5;

範圍列可以用到索引（聯合索引必須是最左字首），但是範圍列後面的列無法用到索引，索引最多用於一個範圍列，如果查詢條件中有兩個範圍列則無法全用到索引：

EXPLAIN SELECT * FROM user WHERE status>5 AND age<24;

如果是範圍查詢和等值查詢同時存在，優先匹配等值查詢列的索引：

EXPLAIN SELECT * FROM user WHERE status>5 AND age=24;

8）資料庫執行計算不會命中索引。

EXPLAIN SELECT * FROM user WHERE age>24;

EXPLAIN SELECT * FROM user WHERE age+1>24;

計算邏輯應該儘量放到業務層處理，節省資料庫的CPU的同時最大限度的命中索引。

9）利用覆蓋索引進行查詢，避免回表。

被查詢的列，資料能從索引中取得，而不用通過行定位符row-locator再到row上獲取，即“被查詢列要被所建的索引覆蓋”，這能夠加速查詢速度。

user表的索引詳情：

因為status欄位是索引列，所以直接從索引中就可以獲取值，不必回表查詢：

Using Index代表從索引中查詢：

EXPLAIN SELECT status FROM user where status=1;

當查詢其他列時，就需要回表查詢，這也是為什麼要避免SELECT*的原因之一：

EXPLAIN SELECT * FROM user where status=1;

10）建立索引的列，不允許為null。

單列索引不存null值，複合索引不存全為null的值，如果列允許為null，可能會得到“不符合預期”的結果集，所以，請使用not null約束以及預設值。

remark列建立索引：

ALTER TABLE user ADD INDEX index_remark (remark);

IS NULL可以命中索引：

EXPLAIN SELECT * FROM user WHERE remark IS NULL;

IS NOT NULL不能命中索引：

EXPLAIN SELECT * FROM user WHERE remark IS NOT NULL;

雖然IS NULL可以命中索引，但是NULL本身就不是一種好的資料庫設計，應該使用NOT NULL約束以及預設值。

a. 更新十分頻繁的欄位上不宜建立索引：因為更新操作會變更B+樹，重建索引。這個過程是十分消耗資料庫效能的。

b. 區分度不大的欄位上不宜建立索引：類似於性別這種區分度不大的欄位，建立索引的意義不大。因為不能有效過濾資料，效能和全表掃描相當。另外返回資料的比例在30%以外的情況下，優化器不會選擇使用索引。

c. 業務上具有唯一特性的欄位，即使是多個欄位的組合，也必須建成唯一索引。雖然唯一索引會影響insert速度，但是對於查詢的速度提升是非常明顯的。另外，即使在應用層做了非常完善的校驗控制，只要沒有唯一索引，在併發的情況下，依然有髒資料產生。

d. 多表關聯時，要保證關聯欄位上一定有索引。

e. 建立索引時避免以下錯誤觀念：索引越多越好，認為一個查詢就需要建一個索引；寧缺勿濫，認為索引會消耗空間、嚴重拖慢更新和新增速度；抵制唯一索引，認為業務的唯一性一律需要在應用層通過“先查後插”方式解決；過早優化，在不瞭解系統的情況下就開始優化。

3. 小結

對於自己編寫的SQL查詢語句，要儘量使用EXPLAIN命令分析一下，做一個對SQL效能有追求的程式設計師。衡量一個程式設計師是否靠譜，SQL能力是一個重要的指標。作為後端程式設計師，深以為然。

掃描下方二維碼，及時獲取更多網際網路求職面經、java、python、爬蟲、大資料等技術，和海量資料分享：公眾號後臺回覆“csdn”即可免費領取【csdn】和【百度文庫】下載服務；公眾號後臺回覆“資料”:即可領取5T精品學習資料、java面試考點和java面經總結，以及幾十個java、大資料專案，資料很全，你想找的幾乎都有

推薦閱讀

☞真實靠譜：百度的職級、薪資、及晉升潛規則

MySQL索引優化看這篇文章就夠了！
2019-01-27
MySql索引優化
MySQL命令，一篇文章替你全部搞定
2018-04-29
MySql
MySQL索引優化
2021-01-05
MySql索引優化
mysql優化索引
2020-12-23
MySql優化索引
一篇文章搞定Markdown
2018-05-05
Mysql索引優化（一）
2020-12-02
MySql索引優化
MySQL調優之索引優化
2021-11-09
MySql索引優化
MySQL 筆記 - 索引優化
2018-08-12
MySql筆記索引優化
MySQL——索引優化實戰
2018-08-08
MySql索引優化
MySQL 字串索引優化方案
2020-07-01
MySql字串索引優化
MySQL 索引原理以及優化
2019-06-03
MySql索引優化
MySQL優化之索引解析
2022-03-15
MySql優化索引
mysql索引原理及優化
2021-06-20
MySql索引優化
Mysql索引優化之索引的分類
2019-07-04
MySql索引優化
一篇文章搞定前端面試
2018-10-01
前端面試
一篇文章帶你搞定HashTable
2020-10-27
mysql索引的使用和優化
2018-10-25
MySql索引優化
MySQL索引與查詢優化
2019-04-13
MySql索引優化
MySQL 索引使用策略及優化
2019-08-07
MySql索引優化
mysql優化篇（基於索引）
2020-10-22
MySql優化索引
MySQL函式索引及優化
2020-07-04
MySql函式索引優化
MySQL-效能優化-索引和查詢優化
2018-06-03
MySql優化索引
一篇文章搞定javascript氣泡排序
2018-12-18
JavaScript排序
一篇文章搞定Python多程式(全)
2019-05-05
Python
一篇文章搞定Python中的類
2021-09-11
Python
淺談MySQL的B樹索引與索引優化
2018-03-26
MySql索引優化
MySQL 效能優化——B+Tree 索引
2019-03-16
MySql優化索引
MySQL-索引優化全攻略
2018-12-07
MySql索引優化
「MySQL」高效能索引優化策略
2019-03-02
MySql索引優化
MySQL 索引優化 Using where, Using filesort
2020-10-26
MySql索引優化
MySQL效能優化之索引設計
2022-03-08
MySql優化索引
mysql索引優化和TCP協議
2020-12-31
MySql索引優化TCP協議
一篇文章搞定 javascript 正規表示式
2019-03-02
JavaScript
一篇文章搞定SpringMVC引數繫結
2019-02-13
SpringMVC
效能調優-Mysql索引資料結構詳解與索引優化
2021-11-04
MySql索引資料結構優化
一篇文章講清楚MySQL的聚簇/聯合/覆蓋索引、回表、索引下推
2022-06-25
MySql索引
【MySQL】MySQL的執行計劃及索引優化
2019-02-25
MySql索引優化
MySQL優化學習筆記之索引
2018-10-22
MySql優化筆記索引

一篇文章搞定 MySQL 索引優化

相關文章