MySQL統計資訊簡介

暖夏未眠丶發表於2018-01-25

MySQL執行SQL會經過SQL解析和查詢優化的過程,解析器將SQL分解成資料結構並傳遞到後續步驟,查詢優化器發現執行SQL查詢的最佳方案、生成執行計劃。查詢優化器決定SQL如何執行,依賴於資料庫的統計資訊,下面我們介紹MySQL 5.7中innodb統計資訊的相關內容。

MySQL執行SQL會經過SQL解析和查詢優化的過程,解析器將SQL分解成資料結構並傳遞到後續步驟,查詢優化器發現執行SQL查詢的最佳方案、生成執行計劃。查詢優化器決定SQL如何執行,依賴於資料庫的統計資訊,下面我們介紹MySQL 5.7中innodb統計資訊的相關內容。

MySQL統計資訊的儲存分為兩種,非持久化和持久化統計資訊。

一、非持久化統計資訊

非持久化統計資訊儲存在記憶體裡,如果資料庫重啟,統計資訊將丟失。有兩種方式可以設定為非持久化統計資訊:

879c376f144aa0c9589941dabd9535bf36f432ff

非持久化統計資訊在以下情況會被自動更新:

beb473dc16eefb60dc91a4ae9d1c39a78dadc689

非持久化統計資訊的缺點顯而易見,資料庫重啟後如果大量表開始更新統計資訊,會對例項造成很大影響,所以目前都會使用持久化統計資訊。

二、持久化統計資訊

5.6.6開始,MySQL預設使用了持久化統計資訊,即

,持久化統計資訊儲存在表

持久化統計資訊在以下情況會被自動更新:

4f13e2017b9cd4e6c7906a01159117b2dc3ebec7

是表的統計資訊,是索引的統計資訊,各欄位含義如下:

acfbef5d8024047cd6465a78851bda5c67043000
為更好的理解,建一張測試表做說明:

CREATE TABLE t1 (

 a INT, b INT, c INT, d INT, e INT, f INT,

 PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)

) ENGINE=INNODB;複製程式碼

寫入資料如下:

401f913d8be4bbb21bedf37ae3822d1f47cc15c2

檢視t1表的統計資訊,需主要關注

欄位

e0efc871a8bd40e1ee14f8ec31de5ba3306539fd

時:表示索引的頁的數量

時:表示葉子節點的數量

時:表示索引欄位上唯一值的數量,此處做一下具體說明:

1、

表示索引第一列之後的數量,如的a列,只有一個值1,所以時,

2、

表示索引前兩列之後的數量,如列,有4個值,所以時,

3、對於非唯一索引,會在原有列之後加上主鍵索引,如

,在原索引列c,d後加了主鍵列結果為2。

瞭解了

的具體含義,就可以協助我們排查SQL執行時為什麼沒有使用合適的索引,例如某個索引遠小於實際值,查詢優化器認為該索引選擇度較差,就有可能導致使用錯誤的索引。

三、統計資訊不準確的處理

我們檢視執行計劃,發現未使用正確的索引,如果是

中統計資訊差別較大引起,可通過以下方式處理:

1、手動更新統計資訊,注意執行過程中會加讀鎖:

;

2、如果更新後統計資訊仍不準確,可考慮增加表取樣的資料頁,兩種方式可以修改:

a) 全域性變數

,預設為20;

b) 單個表可以指定該表的取樣:

;

經測試,此處

的最大值是65535,超出會報錯。

目前MySQL並沒有提供直方圖的功能,某些情況下(如資料分佈不均)僅僅更新統計資訊不一定能得到準確的執行計劃,只能通過

的方式指定索引。新版本8.0會增加直方圖功能,讓我們期待MySQL越來越強大的功能吧!


原文釋出時間為:2018-01-23

本文作者:王小龍

本文來自雲棲社群合作伙伴“老葉茶館”,瞭解相關資訊可以關注“老葉茶館”微信公眾號


原文連結


相關文章