優化MySQL中的分頁

yemengying.com發表於2016-07-07

一道面試的問題，當MySQL表中有資料量很大的時候如何做分頁。。。。當時只知道在資料量很大的時候可以分表，但不知道不分表時可以怎麼做。。。。唉，誰讓代理商就那麼幾條資料，一個簡單的limit，offset就完全hold住了(捂臉)。。。

　　很多應用往往只展示最新或最熱門的幾條記錄，但為了舊記錄仍然可訪問，所以就需要個分頁的導航欄。然而，如何通過MySQL更好的實現分頁，始終是比較令人頭疼的問題。雖然沒有拿來就能用的解決辦法，但瞭解資料庫的底層或多或少有助於優化分頁查詢。

　　我們先從一個常用但效能很差的查詢來看一看。

SELECT *
FROM city
ORDER BY id DESC
LIMIT 0, 15

　　這個查詢耗時0.00sec。So，這個查詢有什麼問題呢？實際上，這個查詢語句和引數都沒有問題，因為它用到了下面表的主鍵，而且只讀取15條記錄。

CREATE TABLE city (
  id int(10) unsigned NOT NULL AUTO_INCREMENT,
  city varchar(128) NOT NULL,
  PRIMARY KEY (id)
) ENGINE=InnoDB;

　　真正的問題在於offset(分頁偏移量)很大的時候，像下面這樣：

SELECT *
FROM city
ORDER BY id DESC
LIMIT 100000, 15;

　　上面的查詢在有2M行記錄時需要0.22sec，通過EXPLAIN檢視SQL的執行計劃可以發現該SQL檢索了100015行，但最後只需要15行。大的分頁偏移量會增加使用的資料，MySQL會將大量最終不會使用的資料載入到記憶體中。就算我們假設大部分網站的使用者只訪問前幾頁資料，但少量的大的分頁偏移量的請求也會對整個系統造成危害。Facebook意識到了這一點，但Facebook並沒有為了每秒可以處理更多的請求而去優化資料庫，而是將重心放在將請求響應時間的方差變小。

　　對於分頁請求，還有一個資訊也很重要，就是總共的記錄數。我們可以通過下面的查詢很容易的獲取總的記錄數。

SELECT COUNT(*)
FROM city;

　　然而，上面的SQL在採用InnoDB為儲存引擎時需要耗費9.28sec。一個不正確的優化是採用SQL_CALC_FOUND_ROWS,SQL_CALC_FOUND_ROWS可以在能夠在分頁查詢時事先準備好符合條件的記錄數，隨後只要執行一句select FOUND_ROWS(); 就能獲得總記錄數。但是在大多數情況下，查詢語句簡短並不意味著效能的提高。不幸的是，這種分頁查詢方式在許多主流框架中都有用到，下面看看這個語句的查詢效能。

SELECT SQL_CALC_FOUND_ROWS *
FROM city
ORDER BY id DESC
LIMIT 100000, 15;

　　這個語句耗時20.02sec，是上一個的兩倍。事實證明使用SQL_CALC_FOUND_ROWS做分頁是很糟糕的想法。

　　下面來看看到底如何優化。文章分為兩部分，第一部分是如何獲取記錄的總數目，第二部分是獲取真正的記錄。

　高效的計算行數

　　如果採用的引擎是MyISAM，可以直接執行COUNT(*)去獲取行數即可。相似的，在堆表中也會將行數儲存到表的元資訊中。但如果引擎是InnoDB情況就會複雜一些，因為InnoDB不儲存表的具體行數。

　　我們可以將行數快取起來，然後可以通過一個守護程式定期更新或者使用者的某些操作導致快取失效時，執行下面的語句：

SELECT COUNT(*)
FROM city
USE INDEX(PRIMARY);

獲取記錄

　　下面進入這篇文章最重要的部分，獲取分頁要展示的記錄。上面已經說過了，大的偏移量會影響效能，所以我們要重寫查詢語句。為了演示，我們建立一個新的表“news”，按照時事性排序(最新發布的在最前面)，實現一個高效能的分頁。為了簡單，我們就假設最新發布的新聞的Id也是最大的。

CREATE TABLE news(
   id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT,
   title VARCHAR(128) NOT NULL
) ENGINE=InnoDB;

　　一個比較高效的方式是基於使用者展示的最後一個新聞Id。查詢下一頁的語句如下，需要傳入當前頁面展示的最後一個Id。

SELECT *
FROM news WHERE id < $last_id
ORDER BY id DESC
LIMIT $perpage

　　查詢上一頁的語句類似，只不過需要傳入當前頁的第一個Id，並且要逆序。

SELECT *
FROM news WHERE id > $last_id
ORDER BY id ASC
LIMIT $perpage

　　上面的查詢方式適合實現簡易的分頁，即不顯示具體的頁數導航，只顯示“上一頁”和“下一頁”，例如部落格中頁尾顯示“上一頁”，“下一頁”的按鈕。但如果要實現真正的頁面導航還是很難的,下面看看另一種方式。

SELECT id
FROM (
   SELECT id, ((@cnt:= @cnt + 1) + $perpage - 1) % $perpage cnt
   FROM news 
   JOIN (SELECT @cnt:= 0)T
   WHERE id < $last_id
   ORDER BY id DESC
   LIMIT $perpage * $buttons
)C
WHERE cnt = 0;

　　通過上面的語句可以為每一個分頁的按鈕計算出一個offset對應的id。這種方法還有一個好處。假設，網站上正在釋出一片新的文章，那麼所有文章的位置都會往後移一位，所以如果使用者在釋出文章時換頁，那麼他會看見一篇文章兩次。如果固定了每個按鈕的offset Id，這個問題就迎刃而解了。Mark Callaghan發表過一篇類似的部落格，利用了組合索引和兩個位置變數，但是基本思想是一致的。

　　如果表中的記錄很少被刪除、修改，還可以將記錄對應的頁碼儲存到表中，並在該列上建立合適的索引。採用這種方式，當新增一個記錄的時候，需要執行下面的查詢重新生成對應的頁號。

SET p:= 0;
UPDATE news SET page=CEIL((p:= p + 1) / $perpage) ORDER BY id DESC;

　　當然，也可以新增一個專用於分頁的表，可以用個後臺程式來維護。

UPDATE pagination T
JOIN (
   SELECT id, CEIL((p:= p + 1) / $perpage) page
   FROM news
   ORDER BY id
)C
ON C.id = T.id
SET T.page = C.page;

　　現在想獲取任意一頁的元素就很簡單了：

SELECT *
FROM news A
JOIN pagination B ON A.id=B.ID
WHERE page=$offset;

　　還有另外一種與上種方法比較相似的方法來做分頁，這種方式比較試用於資料集相對小，並且沒有可用的索引的情況下—比如處理搜尋結果時。在一個普通的伺服器上執行下面的查詢，當有2M條記錄時，要耗費2sec左右。這種方式比較簡單，建立一個用來儲存所有Id的臨時表即可(這也是最耗費效能的地方)。

CREATE TEMPORARY TABLE _tmp (KEY SORT(random))
SELECT id, FLOOR(RAND() * 0x8000000) random
FROM city;

ALTER TABLE _tmp ADD OFFSET INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, DROP INDEX SORT, ORDER BY random;

　　接下來就可以向下面一樣執行分頁查詢了。

SELECT *
FROM _tmp
WHERE OFFSET >= $offset
ORDER BY OFFSET
LIMIT $perpage;

　　簡單來說，對於分頁的優化就是。。。避免資料量大時掃描過多的記錄。

　　部落格比較長，所以翻譯的有些粗糙。。。，之後會在好好檢查一遍的。在自己做測試時，有些查詢時間與作者有點不一致，不過作者這篇部落格是寫於2011年的，so~不要在意具體資料，領會精神吧~~

優化 MySQL 中的分頁
2016-07-04
優化MySql
MySQL分頁查詢優化
2020-10-13
MySql優化
MySQL分頁效能優化指南
2016-07-04
MySql優化
MySQL分優化之超大頁查詢
2020-11-12
MySql優化
SQL優化：limit分頁優化
2017-03-28
SQL優化MIT
MySQL——優化巢狀查詢和分頁查詢
2018-11-01
MySql優化巢狀
mysql count函式與分頁功能極限優化
2021-01-14
MySql函式優化
mysql大資料量分頁查詢方法及其優化
2017-05-27
MySql大資料優化
分頁查詢優化
2020-04-05
優化
MySQL 海量資料的 5 種分頁方法和優化技巧
2019-03-08
MySql優化
MySQL單表百萬資料記錄分頁效能優化
2016-06-24
MySql優化
oracle 分頁優化（stopkey）
2015-09-25
Oracle優化TopK
SQL優化案例-單表分頁語句的優化（八）
2018-11-28
SQL優化
Oracle優化案例-單表分頁語句的優化（八）
2018-11-21
Oracle優化
seo優化中不容忽視的頁面優化
2017-08-23
優化
SQL Server的分頁優化及Row_Number()分頁存在的問題
2015-01-06
SQLServer優化
一次簡單的分頁優化
2019-02-10
優化
關於分頁查詢的優化思路
2014-09-26
優化
一次分頁查詢的優化
2012-03-14
優化
記一次分頁優化
2021-07-26
優化
Mysql索引優化之索引的分類
2019-07-04
MySql索引優化
MySQL查詢中分頁思路的優化BF
2022-03-21
MySql優化
mysql分頁-limit offset分頁
2019-03-08
MySqlMIT
Web 頁面優化專項 > Lighthouse > 效能分數優化
2022-03-11
Web優化
mysql優化之讀寫分離
2018-10-12
MySql優化
MySQL 千萬資料庫深分頁查詢優化，拒絕線上故障！
2022-06-17
MySql資料庫優化
MySQL的分頁查詢
2020-01-15
MySql
Oracle rownum 分頁引起的效率問題及優化思路
2014-12-19
Oracle優化
mysql的優化
2013-09-24
MySql優化
mysql中limit的用法詳解[資料分頁常用]
2016-05-06
MySqlMIT
Python如何優化列表介面進行分頁
2021-10-10
Python優化
Mysql 分頁效率不同的SQL
2011-06-24
MySql
得物面試：MySQL 深度分頁如何最佳化？
2024-01-18
面試MySql
MySQL、Elasticsearch 深度分頁
2023-04-16
MySqlElasticsearch
mysql的sql優化
2017-11-22
MySql優化
MySQL全面瓦解21（番外）：一次深夜優化億級資料分頁的奇妙經歷
2021-01-27
MySql優化
MySQL百分位數計算(優化版)
2018-07-02
MySql優化
MySQL優化（1）——–常用的優化步驟
2018-07-23
MySql優化

優化MySQL中的分頁

高效的計算行數

獲取記錄

相關文章

　高效的計算行數