MySQL最佳化GROUP BY方案

z_paul發表於2021-09-09

執行GROUP BY子句的最一般的方法:先掃描整個表,然後建立一個新的臨時表,表中每個組的所有行應為連續的,最後使用該臨時表來找到組並應用聚集函式(如果有聚集函式)。在某些情況中,MySQL透過訪問索引就可以得到結果,而不用建立臨時表。此類查詢的 EXPLAIN 輸出顯示 Extra列的值為 Using index for group-by。

一。 鬆散索引掃描

1.滿足條件

  查詢針對一個表。
 GROUP BY 使用索引的最左字首。
 只可以使用MIN()和MAX()聚集函式,並且它們均指向相同的列。
2.示例

表t1(c1,c2,c3,c4) 有一個索引 idx(c1,c2,c3):

?

12345678910111213 SELECT c1, c2 FROM t1 GROUP BY c1, c2; SELECT DISTINCT c1, c2 FROM t1; SELECT c1, MIN(c2) FROM t1 GROUP BY c1; SELECT c1, c2 FROM t1 WHERE c1 GROUP BY c1, c2; SELECT MAX(c3), MIN(c3), c1, c2 FROM t1 WHERE c2 > const GROUP BY c1, c2; SELECT c2 FROM t1 WHERE c1 GROUP BY c1, c2; SELECT c1, c2 FROM t1 WHERE c3 = const GROUP BY c1, c2;

不滿足條件示例:

1. 除了MIN()或MAX(),還有其它累積函式,例如:

?

1 SELECT c1, SUM(c2) FROM t1 GROUP BY c1;

2. GROUP BY子句中的域不引用索引開頭,例如:

?

1 SELECT c1,c2 FROM t1 GROUP BY c2, c3;

3. 查詢引用了GROUP BY 部分後面的關鍵字的一部分,並且沒有等於常量的等式,例如:  

?

1 SELECT c1,c3 FROM t1 GROUP BY c1, c2;

二。緊湊索引掃描

如果不滿足鬆散索引掃描條件,執行GROUP BY仍然可以不用建立臨時表。如果WHERE子句中有範圍條件,該方法只讀取滿足這些條件的關鍵字。

否則,進行索引掃描。該方法讀取由WHERE子句定義的範圍。

1. GROUP BY 中有一個漏洞,但已經由條件c2 = 'a'覆蓋。

?

1 SELECT c1,c2,c3 FROM t1 WHERE c2 = 'a' GROUP BY c1,c3;

2. GROUP BY 不是滿足最左字首,但是有一個條件提供該元素的常量:

?

1 SELECT c1,c2,c3 FROM t1 WHERE c1 = 'a' GROUP BY c2,c3;


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/75/viewspace-2804395/,如需轉載,請註明出處,否則將追究法律責任。

相關文章