面試題:瞭解MySQL的Flush-List嗎?順便說一下髒頁的落盤機制!(文末送書)

賜我白日夢發表於2020-11-18

Hi,大家好!我是白日夢!

今天我要跟你分享的MySQL話題是:“瞭解Flush-List嗎?順便說一下髒頁的落盤機制!(文末送書)”

本文是MySQL專題的第 8 篇,共110篇。


一、回顧

現在稍微回顧一下:前面幾篇文章介紹了LRU List、Free List。

MySQL啟動後Buffer Pool會初始化。Buffer Pool也會初始化好N多個空白的快取頁,以及它們的描述資料會被組織成LRU連結串列以及FreeList 雙向連結串列。

這時你從磁碟中讀取一個資料頁,會先從Free List中找出一個空閒快取頁的描述資訊,然後將你讀出的資料頁中載入進快取頁中。同時將快取頁的描述資訊從Free List中剔除,此外該描述資訊塊還會被維護進LRU連結串列中。

資料頁被載入進Buffer Pool後你就可以對其進行變更操作了。


二、Flush List

為了加快響應客戶端的速度,MySQL會在Buffer Pool中對資料進行修改,可是一旦你對LRU連結串列中的快取頁做了修改,那該頁中的資料和磁碟中的資料頁資訊就不一致了!大家一般管這種資料頁叫做髒頁。

為了保證資料的最終一致性,MySQL是需要將髒頁重新整理回磁碟的!

但是問題是:需要將哪些資料頁重新整理回磁碟呢?

這就引出了Flush List~

Flush List 和 Free List很像,都是由Buffer Pool中資料描述資訊組織而成的雙向連結串列。

一旦你對記憶體中的緩衝頁作出了修改,那該緩衝頁對應的描述資訊塊就會新增進 Flush List。這樣當Buffer Pool中的資料頁不夠用時,我們就可以優先將 Flush List中的髒資料頁重新整理進磁碟中。

如果你讀了前幾篇文章那你肯定知道了 LRUList、FreeList、FlushList、Buffer Pool、髒頁、髒資料。

下面乘勝追擊!一起看一下髒頁的落盤機制


三、什麼是髒頁?什麼是髒資料?

  • 什麼是髒頁?

    我在介紹Flush List 的那篇文章有提及,髒頁就是LRU連結串列中被修改了的快取頁。他們和磁碟中的資料頁不一致,髒頁是需要被重新整理回磁碟的。

  • 什麼是髒資料?

    這個問題其實引出了髒讀的概念。舉個例子:事物A中讀取到了事物B中未提交的資料,我們管這些資料叫做髒資料。


四、髒頁刷回磁碟的時機

當Buffer Pool不夠用時,根據LRU機制,MySQL會將Old SubList部分的快取頁移出LRU連結串列。如果被移除出去的快取頁的描述資訊在Flush List中,MySQL就得將其重新整理回磁碟。

InnoDB儲存引擎將髒頁刷回磁碟的時機有蠻多的,你可以把它當作擴充知識大概瀏覽一下。

1、當MySQL資料庫關閉時,會將所有的髒資料頁重新整理回磁碟。這個功能由引數:innodb_fast_shutdown=0控制,預設讓InnoDB在關閉前將髒頁刷回磁碟,以及清理掉undo log。

2、有一個後臺執行緒Master Thread會按照每秒或者每十秒的速度,非同步的將Buffer Pool中一定比例的頁面重新整理回磁碟中。

3、在MySQL5.7中,Buffer Pool的重新整理由page cleaner threads完成。

  • 我們可以通過innodb_page_cleaners引數控制page cleaner threads執行緒的數量,但是當你將這個數值調整的比Buffer Pool的數量還大時,MySQL會自動將 innodb_page_cleaners數量設定為innodb_buffer_pool_instances的數量。
  • Innodb1.1.x之前需要保證LRU列表中有至少100個空閒頁可以使用。低於這個閾值就會觸發髒頁的重新整理。
  • 從MySQL5.6,也就是innodb1.2.X開始,innodb_lru_scan_depth引數為每個緩衝池例項指定page cleaner threads 掃描Buffer Pool來查詢要重新整理的髒頁的下行距離。預設為1024,該後臺執行緒每秒都會執行一次。

4、當髒資料頁太多時,也會觸發將髒資料頁重新整理回磁碟。該機制可由引數innodb_nax_dirty_pages_pct控制,比如將其設定為75,表示,當Buffer Pool中的髒資料頁達到整體快取的75%時,觸發重新整理的動作。現實情況是該引數預設值為0。以此來禁用Buffer Pool早期的重新整理行為。

5、當redo log不可用時,也會強制髒頁列表中的髒頁重新整理回磁碟。這個機制同樣由一個後臺執行緒完成。


六、其他關於髒頁重新整理的知識點

重新整理臨接資料頁:意思是當MySQL將某髒頁重新整理回磁碟時,是否也以相同的態度將該髒頁鄰接的髒頁一併重新整理回磁碟。

可以通過引數innodb_flush_neighbors控制該過程。

  • 設定為0時表示,禁用重新整理鄰接的功能。
  • 設定為1時表示,以相同的態度重新整理其鄰接的髒頁。
  • 設定為2時表示,以相同的程度重新整理髒頁。

那如何選擇將其設定為哪種狀態呢?

你可以根據MySQL例項所在機器的儲存型別來決定。如果為HDD儲存建議將其開啟,因為HDD的磁碟重新整理速率較低,開啟該引數後可以有效的減少IO操作。相反如果使用SSD儲存,其本身就有高磁碟IO的特性,建議禁用該引數。


七、推薦閱讀

1、談談MySQL中基數是什麼?

2、聊聊什麼是慢查?如何監控?如何排查?

3、對Not Null欄位插入Null值有啥現象?

4、能談談year、date、datetime、time、timestamp的區別嗎?

5、你有沒有搞混查詢快取和Buffer Pool?談談看!

6、你知道資料庫緩衝池中的LRU-List嗎?

7、瞭解InnoDB的FreeList嗎?談談看!


參考:

https://dev.mysql.com/doc/refman/5.7/en/innodb-parameters.html

https://dev.mysql.com/doc/refman/5.7/en/innodb-buffer-pool-flushing.html

https://dev.mysql.com/doc/refman/5.7/en/innodb-parameters.html#sysvar_innodb_lru_scan_depth

《MySQL技術內幕》


關注送書!《Netty實戰》

文章公號 首發!連載中!關注微信公號回覆:“抽獎” 還可參加抽?活動


相關文章