深入淺出Mysql索引的那些事兒

發表於2019-08-22

原文網址 : https://segmentfault.com/a/1190000020149264

一.索引的作用

一般的應用系統，讀寫比例在10:1左右，而且插入操作和一般的更新操作很少出現效能問題，遇到最多的，也是最容易出問題的，還是一些複雜的查詢操作，所以查詢語句的優化顯然是重中之重。

在資料量和訪問量不大的情況下，mysql訪問是非常快的，是否加索引對訪問影響不大。但是當資料量和訪問量劇增的時候，就會發現mysql變慢，甚至down掉，這就必須要考慮優化sql了，給資料庫建立正確合理的索引，是mysql優化的一個重要手段。

索引的目的在於提高查詢效率，可以類比字典，如果要查“mysql”這個單詞，我們肯定需要定位到m字母，然後從上往下找到y字母，再找到剩下的sql。如果沒有索引，那麼你可能需要把所有單詞看一遍才能找到你想要的。除了詞典，生活中隨處可見索引的例子，如火車站的車次表、圖書的目錄等。它們的原理都是一樣的，通過不斷的縮小想要獲得資料的範圍來篩選出最終想要的結果，同時把隨機的事件變成順序的事件，也就是我們總是通過同一種查詢方式來鎖定資料。

在建立索引時，需要考慮哪些列會用於 SQL 查詢，然後為這些列建立一個或多個索引。事實上，索引也是一種表，儲存著主鍵或索引欄位，以及一個能將每個記錄指向實際表的指標。資料庫使用者是看不到索引的，它們只是用來加速查詢的。資料庫搜尋引擎使用索引來快速定位記錄。

INSERT 與 UPDATE 語句在擁有索引的表中執行會花費更多的時間，而SELECT 語句卻會執行得更快。這是因為，在進行插入或更新時，資料庫也需要插入或更新索引值。

二.索引的建立、刪除

索引的型別：

UNIQUE(唯一索引)：不可以出現相同的值，可以有NULL值
INDEX(普通索引)：允許出現相同的索引內容
PROMARY KEY(主鍵索引)：不允許出現相同的值
fulltext index(全文索引)：可以針對值中的某個單詞，但效率確實不敢恭維
組合索引：實質上是將多個欄位建到一個索引裡，列值的組合必須唯一

溫馨提示：根據《阿里巴巴Java開發手冊》裡的mysql規約，唯一索引建議命名為uk_欄位名，普通索引名則為idx_欄位名。（uk_即unique key; idx_即index的簡稱）。

(1)使用ALTER TABLE語句建立索性

應用於表建立完畢之後再新增。

ALTER TABLE 表名 ADD 索引型別 （unique,primary key,fulltext,index）[索引名]（欄位名）

//普通索引
alter table table_name add index index_name (column_list) ;
//唯一索引
alter table table_name add unique (column_list) ;
//主鍵索引
alter table table_name add primary key (column_list) ;

ALTER TABLE可用於建立普通索引、UNIQUE索引和PRIMARY KEY索引3種索引格式，table_name是要增加索引的表名，column_list指出對哪些列進行索引，多列時各列之間用逗號分隔。索引名index_name可選，預設時，MySQL將根據第一個索引列賦一個名稱。另外，ALTER TABLE允許在單個語句中更改多個表，因此可以同時建立多個索引。

(2)使用CREATE INDEX語句對錶增加索引

CREATE INDEX可用於對錶增加普通索引或UNIQUE索引，可用於建表時建立索引。

CREATE INDEX index_name ON table_name(username(length));

如果是CHAR，VARCHAR型別，length可以小於欄位實際長度；如果是BLOB和TEXT型別，必須指定 length。

//只能新增這兩種索引;
CREATE INDEX index_name ON table_name (column_list)
CREATE UNIQUE INDEX index_name ON table_name (column_list)

table_name、index_name和column_list具有與ALTER TABLE語句中相同的含義，索引名不可選。另外，不能用CREATE INDEX語句建立PRIMARY KEY索引。

(3)刪除索引

刪除索引可以使用ALTER TABLE或DROP INDEX語句來實現。DROP INDEX可以在ALTER TABLE內部作為一條語句處理，其格式如下：

drop index index_name on table_name ;

alter table table_name drop index index_name ;

alter table table_name drop primary key ;

其中，在前面的兩條語句中，都刪除了table_name中的索引index_name。而在最後一條語句中，只在刪除PRIMARY KEY索引中使用，因為一個表只可能有一個PRIMARY KEY索引，因此不需要指定索引名。如果沒有建立PRIMARY KEY索引，但表具有一個或多個UNIQUE索引，則MySQL將刪除第一個UNIQUE索引。

如果從表中刪除某列，則索引會受影響。對於多列組合的索引，如果刪除其中的某列，則該列也會從索引中刪除。如果刪除組成索引的所有列，則整個索引將被刪除。

(4) 組合索引與字首索引

在這裡要指出，組合索引和字首索引是對建立索引技巧的一種稱呼，並不是索引的型別。為了更好的表述清楚，建立一個demo表如下。

create table USER_DEMO
(
   ID                   int not null auto_increment comment '主鍵',
   LOGIN_NAME           varchar(100) not null comment '登入名',
   PASSWORD             varchar(100) not null comment '密碼',
   CITY                 varchar(30) not null comment '城市',
   AGE                  int not null comment '年齡',
   SEX                  int not null comment '性別(0:女 1：男)',
   primary key (ID)
);

為了進一步榨取mysql的效率，就可以考慮建立組合索引，即將LOGIN_NAME,CITY,AGE建到一個索引裡：

ALTER TABLE USER_DEMO ADD INDEX name_city_age (LOGIN_NAME(16),CITY,AGE);

建表時，LOGIN_NAME長度為100，這裡用16，是因為一般情況下名字的長度不會超過16，這樣會加快索引查詢速度，還會減少索引檔案的大小，提高INSERT，UPDATE的更新速度。

如果分別給LOGIN_NAME,CITY,AGE建立單列索引，讓該表有3個單列索引，查詢時和組合索引的效率是大不一樣的，甚至遠遠低於我們的組合索引。雖然此時有三個索引，但mysql只能用到其中的那個它認為似乎是最有效率的單列索引，另外兩個是用不到的，也就是說還是一個全表掃描的過程。

建立這樣的組合索引，就相當於分別建立如下三種組合索引：

LOGIN_NAME,CITY,AGE
LOGIN_NAME,CITY
LOGIN_NAME

為什麼沒有CITY,AGE等這樣的組合索引呢？這是因為mysql組合索引“最左字首"的結果。簡單的理解就是隻從最左邊的開始組合，並不是只要包含這三列的查詢都會用到該組合索引。也就是說name_city_age(LOGIN_NAME(16),CITY,AGE)從左到右進行索引，如果沒有左前索引，mysql不會執行索引查詢。

如果索引列長度過長,這種列索引時將會產生很大的索引檔案,不便於操作,可以使用字首索引方式進行索引，字首索引應該控制在一個合適的點,控制在0.31黃金值即可(大於這個值就可以建立)。

SELECT COUNT(DISTINCT(LEFT(`title`,10)))/COUNT(*) FROM Arctic; -- 這個值大於0.31就可以建立字首索引,Distinct去重複

ALTER TABLE `user` ADD INDEX `uname`(title(10)); -- 增加字首索引SQL,將人名的索引建立在10,這樣可以減少索引檔案大小,加快索引查詢速度

三.索引的使用及注意事項

EXPLAIN可以幫助開發人員分析SQL問題,explain顯示了mysql如何使用索引來處理select語句以及連線表,可以幫助選擇更好的索引和寫出更優化的查詢語句。

使用方法,在select語句前加上Explain就可以了：

Explain select * from user where id=1;

儘量避免這些不走索引的sql：

SELECT name,phone FROM `user` WHERE `age`+10=30; -- 不會使用索引,因為所有索引列參與了計算

SELECT name,phone  FROM `user` WHERE LEFT(`date`,4) <1990; -- 不會使用索引,因為使用了函式運算,原理與上面相同

SELECT * FROM `user` WHERE `name` LIKE'後盾%' -- 走索引

SELECT * FROM `user` WHERE `name` LIKE "%後盾%" -- 不走索引

-- 正規表示式不使用索引,這應該很好理解,所以為什麼在SQL中很難看到regexp關鍵字的原因

-- 字串與數字比較不使用索引;
CREATE TABLE `a` (`a` char(10));
EXPLAIN SELECT * FROM `a` WHERE `a`="1" -- 走索引
EXPLAIN SELECT * FROM `a` WHERE `a`=1 -- 不走索引

select * from dept where dname='xxx' or loc='xx' or deptno=45 --如果條件中有or,即使其中有條件帶索引也不會使用。換言之,就是要求使用的所有欄位,都必須建立索引, 我們建議大家儘量避免使用or 關鍵字

-- 如果mysql估計使用全表掃描要比使用索引快,則不使用索引

索引雖然好處很多，但過多的使用索引可能帶來相反的問題，索引也是有缺點的：

雖然索引大大提高了查詢速度，同時卻會降低更新表的速度，如對錶進行INSERT,UPDATE和DELETE。因為更新表時，mysql不僅要儲存資料，還要儲存一下索引檔案
建立索引會佔用磁碟空間的索引檔案。一般情況這個問題不太嚴重，但如果你在要給大表上建了多種組合索引，索引檔案會膨脹很寬

索引只是提高效率的一個方式，如果mysql有大資料量的表，就要花時間研究建立最優的索引，或優化查詢語句。

使用索引時，有一些技巧

索引不會包含有NULL的列
只要列中包含有NULL值，都將不會被包含在索引中，複合索引中只要有一列含有NULL值，那麼這一列對於此符合索引就是無效的。
使用短索引
對串列進行索引，如果可以就應該指定一個字首長度。例如，如果有一個char（255）的列，如果在前10個或20個字元內，多數值是唯一的，那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁碟空間和I/O操作。
索引列排序
mysql一張表查詢只能用到一個索引。因此如果where子句中已經使用了索引的話，那麼order by中的列是不會使用索引的。因此資料庫預設排序可以符合要求的情況下不要使用排序操作，儘量不要包含多個列的排序，如果需要最好給這些列建複合索引。這一點是很多程式猿容易忽略的，如where子句的欄位建了索引，排序的欄位建了索引，但是分開建的，以為會走索引，其實這樣的話排序的欄位不會使用索引的，除非建複合索引，切記。
like語句操作
一般情況下不鼓勵使用like操作，如果非使用不可，注意正確的使用方式。like '%aaa%'不會使用索引，而like 'aaa%'可以使用索引。
不要在列上進行運算
不使用NOT IN 、<>、！=操作，但<,<=，=，>,>=,BETWEEN,IN是可以用到索引的。
索引要建立在經常進行select操作的欄位上。
這是因為，如果這些列很少用到，那麼有無索引並不能明顯改變查詢速度。相反，由於增加了索引，反而降低了系統的維護速度和增大了空間需求。
索引要建立在值比較唯一的欄位上。
對於那些定義為text、image和bit資料型別的列不應該增加索引。因為這些列的資料量要麼相當大，要麼取值很少。
在where和join中出現的列需要建立索引。
where的查詢條件裡有不等號(where column != ...),mysql將無法使用索引。
如果where字句的查詢條件裡使用了函式(如：where DAY(column)=...),mysql將無法使用索引。
在join操作中(需要從多個資料表提取資料時)，mysql只有在主鍵和外來鍵的資料型別相同時才能使用索引，否則即使建立了索引也不會使用。這一點很容易忽略，切記，切記，切記！
在進行聯表查詢時，建立關聯的表的欄位型別最好一樣且長度一致，這樣能更好的發揮索引的作用。
組合索引時切記此條約束：組合索引中有多個欄位，其中一個欄位是有範圍判斷，則需將此欄位在最後面。如
```
 ALTER TABLE USER_DEMO ADD INDEX name_age (NAME,AGE);  
```
因為age會有範圍判斷，則建組合索引時將AGE欄位放在後面。
字符集欄位比較，UTF8與UTF-BIN聯合查詢是不能走索引的。

如某張表的order_no欄位型別為varchar(50),另一張表的order_no欄位型別為varchar(50) COLLATE utf8_BIN。則此時聯合查詢時不能走索引的，切記。
即兩張表的欄位型別如下：
```
 `order_no` varchar(50) COLLATE utf8_bin NOT NULL DEFAULT '' COMMENT '訂單號';
 `order_no` varchar(50) NOT NULL DEFAULT '' COMMENT '訂單號';
```
以下幾種情況不適合建索引：
- 表記錄太少
- 經常插入、刪除、修改的表
- 資料重複且分佈平均的表欄位。如一個表有10萬行記錄，其中欄位column1只有A和B兩種值，且每個值的分佈概率大約為50%，那麼對這種表column1欄位建索引一般不會提高資料庫的查詢速度。
給表建立主鍵，對於沒有主鍵的表，在查詢和索引定義上有一定的影響。
避免表欄位為null，建議設定預設值（如int型別設定預設值為0），這樣在索引查詢上，效率會高很多。
關於order by的索引問題重點說下:
- 無條件查詢如果只有order by create_time，即便create_time上有索引，也不會使用到。
  因為優化器認為走二級索引再去回表成本比全表掃描排序更高，所以選擇走權標掃描。
- 無條件查詢但是order by create_time limit m，如果m值較小，是可以走索引的。
  因為優化器認為根據索引有序性去回表查資料，然後得到m條資料，就可以終止迴圈，
  那麼成本比全表掃描小，則選擇走二級索引。
  即便沒有二級索引，mysql針對order by limit也做了優化，採用堆排序。
- order by排序分為file sort和index，index的效率更高。但以下情況不會使用index排序：
  - 檢查的行數過多，並且沒有使用覆蓋索引
  - 使用了多個索引，mysql一次只會採用一個索引
  - where和order by使用了不同的索引，與上一條類似
  - order by中加入了非索引列，且非索引列不在where中
  - 當使用left join，使用右邊的表欄位排序

參考：
http://dev.mysql.com/doc/refman/5.5/en/explain-output.html

MySql索引那些事
2019-03-31
MySql索引
深入淺出MYSQL的事務隔離
2020-09-26
MySql
MySQL優化那些事兒
2019-03-02
MySql優化
淺入淺出 MySQL 索引
2021-05-17
MySql索引
MySQL資料遷移那些事兒
2021-05-06
MySql
https的那些事兒
2019-02-21
HTTP
webpack的那些事兒
2019-05-12
Web
淺談AsyncLocal，我們應該知道的那些事兒
2020-11-29
深入淺出Mysql索引優化專題分享|面試怪圈
2021-12-19
MySql索引優化面試
PHP那些事兒
2019-02-16
PHP
Redis那些事兒
2019-02-16
Redis
babel那些事兒
2019-03-14
Babel
Eval家族的那些事兒
2019-03-30
【GoLang 那點事】深入淺出那些你知道但不理解的併發模型
2019-08-19
Golang模型
雲原生java的那些事兒
2019-03-01
Java
util.promisify 的那些事兒
2018-10-17
iOS 截圖的那些事兒
2018-06-03
iOS
HTTP 快取的那些事兒
2018-08-21
HTTP快取
漏洞檢測的那些事兒
2020-08-19
關於 sudo 的那些事兒
2019-12-19
面試的那些事兒--01
2021-03-10
面試
MySQL索引那些事：什麼是索引？為什麼加索引就查得快了？
2021-06-09
MySql索引
Mysql的那些事兒(部分涉及資料庫知識總結)
2018-03-07
MySql資料庫
網路安全那些事兒
2018-11-08
說說RCE那些事兒
2020-08-19
C語言那些事兒
2020-04-04
C語言
PHP 閉包那些事兒
2019-02-16
PHP
字元編碼那些事兒
2021-09-09
字元
聊聊瀏覽器的那些事兒
2019-02-15
瀏覽器
綠帽子水管工的那些事兒
2019-10-15
Filebeat 收集日誌的那些事兒
2020-06-18
[apue] 等待子程式的那些事兒
2019-07-08
我與軟考的那些事兒
2018-03-25
「前端那些事兒」④ 效能監控
2019-04-01
前端
法線貼圖那些事兒
2020-05-25
程式碼重構那些事兒
2019-02-03
Node檔案操作那些事兒
2018-03-20
JavaScript非同步處理的那些事兒
2018-11-12
JavaScript非同步