什麼時候建立組合索引?
當我們的where查詢存在多個條件查詢的時候,我們需要對查詢的列建立組合索引
為什麼不對沒一列建立索引
- 減少開銷
- 覆蓋索引
- 效率高
減少開銷:假如對col1、col2、col3建立組合索引,相當於建立了(col1)、(col1,col2)、(col1,col2,col3)3個索引
覆蓋索引:假如查詢SELECT col1, col2, col3 FROM 表名,由於查詢的欄位存在索引頁中,那麼可以從索引中直接獲取,而不需要回表查詢
效率高:對col1、col2、col3三列分別建立索引,MySQL只會選擇辨識度高的一列作為索引。假設有100w的資料,一個索引篩選出10%的資料,那麼可以篩選出10w的資料;對於組合索引而言,可以篩選出100w*10%*10%*10%=1000條資料
最左匹配原則
假設我們建立(col1,col2,col3)這樣的一個組合索引,那麼相當於對col1列進行排序,也就是我們建立組合索引,以最左邊的為準,只要查詢條件中帶有最左邊的列,那麼查詢就會使用到索引
建立測試表
CREATE TABLE `student` (
`id` int(11) NOT NULL,
`name` varchar(10) NOT NULL,
`age` int(11) NOT NULL,
PRIMARY KEY (`id`),
KEY `idx_id_name_age` (`id`,`name`,`age`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
複製程式碼
填充100w測試資料
DROP PROCEDURE pro10;
CREATE PROCEDURE pro10()
BEGIN
DECLARE i INT;
DECLARE char_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
DECLARE return_str varchar(255) DEFAULT '';
DECLARE age INT;
SET i = 1;
WHILE i < 5000000 do
SET return_str = substring(char_str, FLOOR(1 + RAND()*62), 8);
SET i = i+1;
SET age = FLOOR(RAND() * 100);
INSERT INTO student(id, name, age) values(i, return_str, age);
END WHILE;
END;
CALL pro10();
複製程式碼
場景測試
EXPLAIN SELECT * FROM student WHERE id = 2;
複製程式碼
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND name = 'defghijk';
複製程式碼
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND name = 'defghijk' and age = 8;
複製程式碼
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND age = 8;
複製程式碼
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE name = 'defghijk' AND age = 8;
複製程式碼
可以看到該查詢沒有使用到索引,型別為index,查詢行數為4989449,幾乎進行了全表掃描,由於組合索引只針對最左邊的列進行了排序,對於name、age只能進行全部掃描
EXPLAIN SELECT * FROM student WHERE name = 'defghijk' AND id = 2;
EXPLAIN SELECT * FROM student WHERE age = 8 AND id = 2;
EXPLAIN SELECT * FROM student WHERE name = 'defghijk' and age = 8 AND id = 2;
複製程式碼
可以看到如上查詢也使用到了索引,id放前面和放後面查詢到的結果是一樣的,MySQL會找出執行效率最高的一種查詢方式,就是先根據id進行查詢
總結
如上測試,可以看到只要查詢條件的列中包含組合索引最左邊的那一列,不管該列在查詢條件中的位置,都會使用索引進行查詢。
歡迎各路英雄好漢指正文中的錯誤!