查詢效率提升10倍!3種優化方案,幫你解決MySQL深分頁問題

一燈架構發表於2022-07-03

開發經常遇到分頁查詢的需求,但是當翻頁過多的時候,就會產生深分頁,導致查詢效率急劇下降。

有沒有什麼辦法,能解決深分頁的問題呢?

本文總結了三種優化方案,查詢效率直接提升10倍,一起學習一下。

1. 準備資料

先建立一張使用者表,只在create_time欄位上加索引:

CREATE TABLE `user` (
  `id` int NOT NULL AUTO_INCREMENT COMMENT '主鍵',
  `name` varchar(255) DEFAULT NULL COMMENT '姓名',
  `create_time` timestamp NULL DEFAULT NULL COMMENT '建立時間',
  PRIMARY KEY (`id`),
  KEY `idx_create_time` (`create_time`)
) ENGINE=InnoDB COMMENT='使用者表';

然後往使用者表中插入100萬條測試資料,這裡可以使用儲存過程:

drop PROCEDURE IF EXISTS insertData;
DELIMITER $$
create procedure insertData()
begin
 declare i int default 1;
   while i <= 100000 do
         INSERT into user (name,create_time) VALUES (CONCAT("name",i), now());
         set i = i + 1; 
   end while; 
end $$

call insertData() $$

2. 驗證深分頁問題

每頁10條,當我們查詢第一頁的時候,速度很快:

select * from user 
where create_time>'2022-07-03' 
limit 0,10;

image-20220703181532231.png

在不到0.01秒內直接返回了,所以沒顯示出執行時間。

當我們翻到第10000頁的時候,查詢效率急劇下降:

select * from user 
where create_time>'2022-07-03' 
limit 100000,10;

image-20220703181904656.png

執行時間變成了0.16秒,效能至少下降了幾十倍。

耗時主要花在哪裡了?

  1. 需要掃描前10條資料,資料量較大,比較耗時
  2. create_time是非聚簇索引,需要先查詢出主鍵ID,再回表查詢,通過主鍵ID查詢出所有欄位

畫一下回表查詢流程:

1. 先通過create_time查詢出主鍵ID

image-20220703204919992.png

2. 再通過主鍵ID查詢出表中所有欄位

image-20220703205108719.png

別問為什麼B+樹的結構是這樣的?問就是規定。

可以看一下前兩篇文章。

可以看一下前兩篇文章。

MySQL索引底層實現為什麼要用B+樹?

一篇文章講清楚MySQL的聚簇/聯合/覆蓋索引、回表、索引下推

然後我們就針對這兩個耗時原因進行優化。

3. 優化查詢

3.1 使用子查詢

先用子查詢查出符合條件的主鍵,再用主鍵ID做條件查出所有欄位。

select * from user 
where id in (
  select id from user 
  where create_time>'2022-07-03' 
  limit 100000,10
);

不過這樣查詢會報錯,說是子查詢中不支援使用limit。

image-20220703205602830.png

我們加一層子查詢巢狀,就可以了:

select * from user 
where id in (
 select id from (
    select id from user 
    where create_time>'2022-07-03' 
    limit 100000,10
 ) as t
);

image-20220703205912970.png

執行時間縮短到0.05秒,減少了0.12秒,相當於查詢效能提升了3倍。

為什麼先用子查詢查出符合條件的主鍵ID,就能縮短查詢時間呢?

我們用explain檢視一下執行計劃就明白了:

explain select * from user 
where id in (
 select id from (
    select id from user 
    where create_time>'2022-07-03' 
    limit 100000,10
 ) as t
);

image-20220703215830336.png

可以看到Extra列顯示子查詢中用到Using index,表示用到了覆蓋索引,所以子查詢無需回表查詢,加快了查詢效率。

3.2 使用inner join關聯查詢

把子查詢的結果當成一張臨時表,然後和原表進行關聯查詢。

select * from user 
inner join (
   select id from user 
    where create_time>'2022-07-03' 
    limit 100000,10
) as t on user.id=t.id;

image-20220703220449618.png

查詢效能跟使用子查詢一樣。

3.3 使用分頁遊標(推薦)

實現方式就是:當我們查詢第二頁的時候,把第一頁的查詢結果放到第二頁的查詢條件中。

例如:首先查詢第一頁

select * from user 
where create_time>'2022-07-03' 
limit 10;

然後查詢第二頁,把第一頁的查詢結果放到第二頁查詢條件中:

select * from user 
where create_time>'2022-07-03' and id>10 
limit 10;

這樣相當於每次都是查詢第一頁,也就不存在深分頁的問題了,推薦使用。

image-20220703222259556.png

執行耗時是0秒,查詢效能直接提升了幾十倍。

這樣的查詢方式雖然好用,但是又帶來一個問題,就是無法跳轉到指定頁數,只能一頁頁向下翻。

所以這種查詢只適合特定場景,比如資訊類APP的首頁。

網際網路APP一般採用瀑布流的形式,比如百度首頁、頭條首頁,都是一直向下滑動翻頁,並沒有跳轉到制定頁數的需求。

不信的話,可以看一下,這是頭條的瀑布流:

image-20220703221836032.png

傳參中帶了上一頁的查詢結果。

image-20220703222026194.png

響應資料中,返回了下一頁查詢條件。

所以這種查詢方式的應用場景還是挺廣的,趕快用起來吧。

知識點總結:

image-20220703223109687.png

文章持續更新,可以微信搜一搜「 一燈架構 」第一時間閱讀更多技術乾貨。

相關文章