你知道MySQL的Limit有效能問題嗎

RebeccaZhong發表於2019-05-08

MySQL的分頁查詢通常通過limit來實現。

MySQL的limit基本用法很簡單。limit接收1或2個整數型引數,如果是2個引數,第一個是指定第一個返回記錄行的偏移量,第二個是返回記錄行的最大數目。初始記錄行的偏移量是0。

為了與PostgreSQL相容,limit也支援limit # offset #

問題

對於小的偏移量,直接使用limit來查詢沒有什麼問題,但隨著資料量的增大,越往後分頁,limit語句的偏移量就會越大,速度也會明顯變慢。

優化思想

避免資料量大時掃描過多的記錄

解決

子查詢的分頁方式或者JOIN分頁方式。

JOIN分頁和子查詢分頁的效率基本在一個等級上,消耗的時間也基本一致。

下面舉個例子。一般MySQL的主鍵是自增的數字型別,這種情況下可以使用下面的方式進行優化。

下面以真實的生產環境的80萬條資料的一張表為例,比較一下優化前後的查詢耗時:


-- 傳統limit,檔案掃描
[SQL]SELECT * FROM tableName ORDER BY id LIMIT 500000,2;
受影響的行: 0
時間: 5.371s

-- 子查詢方式,索引掃描
[SQL]
SELECT * FROM tableName
WHERE id >= (SELECT id FROM tableName ORDER BY id LIMIT 500000 , 1)
LIMIT 2;
受影響的行: 0
時間: 0.274s

-- JOIN分頁方式
[SQL]
SELECT *
FROM tableName AS t1
JOIN (SELECT id FROM tableName ORDER BY id desc LIMIT 500000, 1) AS t2
WHERE t1.id <= t2.id ORDER BY t1.id desc LIMIT 2;
受影響的行: 0
時間: 0.278s
複製程式碼

可以看到經過優化效能提高了將近20倍。

優化原理

子查詢是在索引上完成的,而普通的查詢時在資料檔案上完成的,通常來說,索引檔案要比資料檔案小得多,所以操作起來也會更有效率。因為要取出所有欄位內容,第一種需要跨越大量資料塊並取出,而第二種基本通過直接根據索引欄位定位後,才取出相應內容,效率自然大大提升。

因此,對limit的優化,不是直接使用limit,而是首先獲取到offset的id,然後直接使用limit size來獲取資料。

在實際專案使用,可以利用類似策略模式的方式去處理分頁,例如,每頁100條資料,判斷如果是100頁以內,就使用最基本的分頁方式,大於100,則使用子查詢的分頁方式。

相關文章


Wechat-westcall

相關文章