深入理解MySQL索引底層資料結構

京東雲開發者發表於2023-04-06

作者:IT王小二

部落格:https://itwxe.com

MySQL 索引相關的資料結構有兩種,一種是 B+tree,一種是 Hash,那麼為什麼在 99.99% 的情況下都使用的是 B+tree索引呢?

索引的底層資料結構是怎樣的呢?

接下來就聽小二娓娓道來。

一、索引是什麼

MySQL 官方對索引的定義:索引是幫助 MySQL 高效獲取資料的排好序資料結構。所以,可以得出:索引是資料結構

當然啦,上面兩句話可能看起來很抽象,那麼生活中有哪些索引的例子呢。

書籍目錄結構

小二以上圖《書籍》這本為例,書籍的目錄就是按順序排列的,有第一章,第二章...,這就是一種排好序的資料結構。

目錄可以快速幫助我們通過頁數快速定位到我們想看的章節,比如我們想看《書籍》第三章,翻到第55頁...

流鼻血

小孩子不能看《書籍》哈,不然就會像小二一樣流鼻血,哈哈哈。

那比如複雜一點,想要去圖書館找《書籍》這本書的時候。

圖書館圖書結構

圖書館往往會給書籍分類存放,索引是由一個個節點組成,根節點(圖書館)有中間節點(每個樓層的類別),中間節點下面又由子節點(每樓的每一排的類別),最後一層是葉子節點(具體書籍)。

可以看到,索引其實就是是一棵倒掛著的樹,是一種資料結構

小二同時附上一個視覺化資料結構網站,有了它學習資料結構簡單明瞭。

視覺化資料結構網站:https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

視覺化資料結構網站

國外的網站訪問略慢,當然你好不容易進去了問小二為啥不是中文,那當然是因為小二點了一下翻譯啦。

二、二叉樹系列

先來簡單說一說和 B+tree 相關的二叉樹系列:二叉樹、二叉查詢樹和平衡二叉樹

1. 二叉樹

什麼是二叉樹嘞?

  • 每個節點至多隻有二棵子樹,左子樹和右子樹,次序不能顛倒。
  • 邏輯上二叉樹有五種基本形態:空二叉樹、只有一個根結點的二叉樹、只有左子樹、只有右子樹、完全二叉樹(特例為滿二叉樹)。
  • 遍歷是對樹的一種最基本的運算,所謂遍歷二叉樹,就是按一定的規則和順序走遍二叉樹的所有結點,使每一個結點都被訪問一次,而且只被訪問一次,有前序、中序、後序遍歷。

不過,小二不會大篇幅講二叉樹的各種形態,遍歷...,這篇滴主角可是 B+tree。

當然啦,這個時候就有客官要跳出來了,小二明明就是不精通資料結構,還說的這麼好聽。

哈哈哈,看破不說破嘛,當然也有這方面的原因,大學學習的資料結構全部還給可愛的老師啦。

等小二拜讀完《資料結構與演算法之美》再出一期資料結構專題,現在就隨便看看畫的兩個圖將就一下吧,結構還是比較簡單的。

二叉樹

由於資料庫索引是要求排好序資料結構,所以二叉樹是不滿足使用場景的,那麼為了解決排好序這個問題,那麼就引出了二叉查詢樹。

2. 二叉查詢樹

什麼是二叉查詢樹嘞?

  • 二叉查詢樹又名二叉搜尋樹,在滿足二叉樹的條件下,左子樹的節點值總是小於根的節點值,右子樹的節點值總是大於根的節點值,也就是左子樹節點值 < 根的節點值 < 右子樹節點值。

如下圖的設計,將一組資料轉化為二叉查詢樹,設計合理的二叉查詢樹查詢一個節點資料時間複雜度和二分查詢一樣。

設計合理二叉查詢樹

但是如果設計不合理會設計成什麼樣子呢?

設計不良極不平衡時,二叉搜尋樹甚至會變成順序查詢,而不是二分查詢,如下圖所示,同樣一個陣列最後設計出來的二叉查詢樹。

設計不合理二叉查詢樹

可以看到,在查詢69和這個資料時,在第一張圖中,構建合理的二叉查詢樹只需要2次 IO 就能找到資料;而第二張圖中,構建出來的極不平衡二叉查詢樹需要 6 次磁碟 IO 才能找到資料。

所以,二叉搜尋樹解決了資料庫索引排好序的原則,但是二叉查詢樹構建可能極不平衡,最後構建成了一個連結串列,這時候就需要用到平衡二叉樹了,也就是我們平常說的 AVL樹。

3. 平衡二叉樹(AVL樹)

什麼是平衡二叉樹嘞?

  • 首先符合二叉查詢樹的定義,其次必須滿足任何節點的兩個子樹的高度之差的絕對值不超過 1。

上面這句話就很好理解了,也就是說在這個條件下保證了二叉查詢樹的平衡性,類似於下圖結構。

平衡二叉樹

平衡二叉樹相比於二叉查詢樹來說,查詢效率更穩定,總體的查詢速度也更快。

平衡二叉樹的查詢速度的確很快,但是維護一棵平衡二叉樹的代價是非常大的。通常來說,需要1次或多次左旋和右旋來得到插入、更新和刪除後樹的平衡性。

同時平衡二叉樹隨著資料的增多,平衡二叉樹樹的高度會越來越高,大概1000條資料就有9 - 10層,那也就是說可能找一個資料需要9 -10次 IO。

一般來說,一般的機械磁碟每秒至少可以做100次 IO,一次 IO 的時間基本上在0.01秒,也就是說1000條資料在查詢時就需要0.1秒,那如果是10000條,1000000條呢。

所以,為了解決平衡二叉樹高度過高導致的 IO 問題,提出了 B-tree 和 B+tree 資料結構。

三、B-tree和B+tree

為了解決平衡二叉樹高度過高導致的 IO 問題,於是想了個辦法,能不能在每一個節點上多放些元素呢,從而降低平衡二叉樹的高度,減少磁碟 IO,所以就有了 B-tree 和 B+tree。

1. B-tree(B樹)

B-tree 怎麼定義呢?

B-tree 是一種多路搜尋樹,一棵 m 階的 B-Tree 有如下特性:

  • 每個節點最多有 m 個孩子。
  • 若根節點不是葉子節點,則至少有 2 個孩子。
  • 除了根節點和葉子節點外,其它每個節點至少有 Ceil(m/2) 個孩子。
  • 每個非葉子結點節點包含 n 個關鍵字資訊(K1, K2, …, Kn)。關鍵字的個數 n 滿足:Ceil(m/2)-1 <= n <= m-1 。
  • Ki(i = 1, 2, …, n)為關鍵字,且關鍵字升序排序。
  • Pi(i = 1, 2, …, n)為指向子樹根節點的指標,P(i - 1)指向的子樹的所有節點關鍵字均小於K(i),但都大於K(i - 1)。
  • 所有葉子節點都在同一層,且不包含其它關鍵字資訊。

注意:

  • m 階指的是一個節點最多擁有 m 個孩子節點,而不是指的樹的高度,即3階 B-tree 是每個節點都最多擁有3個孩子節點。
  • Ceil(m/2)為向上取整,例如 Ceil(3/2)=2,Ceil(5/2)=3

巴拉巴拉說了這麼多,客官暈了沒,資料機構嘛,當然得結合圖來看,例如一棵3階 B-tree 結構圖。

B-tree資料結構

當然各位客觀要是覺得這個圖不好看,那小二就換個簡化版的圖,這麼貼心值不值得一個點贊呢。

B-tree資料結構簡化

圖中可以看到 B-tree 關鍵字(索引)和資料(除索引外的其他列資料)是放在一起的,沒有儲存冗餘關鍵字(索引),同時通過指標指向孩子節點,關鍵字左邊的孩子節點都比關鍵字小,關鍵字右邊的孩子節點都比關鍵字大。

B-tree 通過多路搜尋的方式大大的降低了樹的高度,大大減少了查詢一個資料的磁碟 IO,比如我要查詢6這個元素的資訊,只需要3次磁碟 IO 就能找到想要的資料。

那麼 MySQL 為什麼沒有選擇 B-tree 而是使用了 B-tree 的變種 B+tree 嘞,跟著小二來看看 B+tree 的結構對比 B-tree 有啥區別再來回答這個問題。

2. B+tree(B+樹)

B+tree怎麼定義呢?

B+樹是B-樹的變體,也是一種多路搜尋樹,其定義基本與 B-tree 相同,存在以下幾點不同之處:

  • 非葉子結點的子樹指標與關鍵字個數相同
  • 非葉子節點只儲存關鍵字資訊(即非葉子節點只儲存索引,不儲存除索引外的其他欄位資訊)。
  • 所有葉子節點之間都有指標相連,指向下一個葉子結點。(當然MySQL做了優化,優化成了雙向迴圈連結串列,啥是雙向迴圈連結串列,看圖就知道啦)
  • 資料記錄都存放在葉子節點中。

一棵3階 B+tree 如圖。

B+tree資料結構

當然,為了理解,簡化版結構圖片小二當然也準備好了。

B+tree資料結構簡化版

可以看到 B+tree 對比 B-tree 所有資料都儲存在葉子節點中,非葉子結點只儲存冗餘索引,同時葉子結點之間使用雙向迴圈連結串列連結。

那麼又引出了下面兩個問題,回答完這兩個問題各位客官就知道為什麼 MySQL 選擇 B+tree 不選擇 B-tree 了。

  1. 為什麼 B+tree 不在非葉子結點儲存除索引外的其他資料呢?

: 為了繼續降低樹的高度,同時讓非葉子結點可以儲存更多的索引。

詳解

在 MySQL 的 InnoDB 中,一個節點被稱為一個資料頁,這個資料頁大小可以通過 show global status like 'Innodb_page_size'; 命令查詢,預設是 16384b,也就是說一個資料頁的大小是 16kb

在 MySQL 的 InnoDB 中一個指標被定義為6位元組,那麼假設主鍵型別為 bigint (8位元組),葉子結點中一條資料為 1k (1024位元組,通常一張二三十個欄位的表一條記錄大小都不會超過1k,除非是大資料型別),那麼一個高度為3的 B+tree 可以儲存多少資料呢?

第一層儲存索引數量:16384/(8+6) = 1170

第二層儲存索引數量:16384/(8+6) = 1170

第三層葉子結點儲存資料數量:16384/1024 = 16

也就是說一個3層高度的 B+tree 可以儲存 1170*1170*16 = 21902400 條資料。

那麼如果主鍵是 int 型別呢,就可以儲存 1638*1638*16 = 42928704 條資料。

接下來對比一下 B-tree,同樣以指標被定義為6位元組,假設主鍵型別為 bigint,一條資料為 1k,3層高的 B-tree 可以儲存多少條資料呢?

第一層儲存資料數量:16384/(1024+6) = 15

第二層儲存資料數量:16384/(1024+6) = 15

第三層儲存資料數量:16384/(1024) = 16

也就是說一個3層高的 B-tree 可以儲存 15*15*16 = 3600 條資料。

對比相同高度下的 B+tree 和 B-tree 可以儲存資料的多少,這麼巨大的差距,那當然選擇 B+tree。

  1. 為什麼葉子結點需要優化成雙向迴圈連結串列?

:因為 B+tree 所有的資料都在葉子結點中,葉子結點之間的雙向迴圈連結串列是為了提高區間訪問的效能,方便範圍查詢資料。

使用 B+tree 不使用 B-tree 原因總結:進一步降低樹的高度 + 非葉子結點存放索引的數量 + 葉子結點間雙向迴圈連結串列提高區間訪問的效能,方便範圍查詢資料。

四、Hash表

理解清楚了為什麼 MySQL索引資料結構使用 B+tree 而不是 各種二叉樹和 B-tree,那麼為什麼 99.99 的情況下都是 B+tree,而不使用 Hash 呢?

先來看看 Hash 作為索引有什麼特點。

  • 對索引的 key 進行一次 Hash 計算就可以定位出資料儲存的位置。
  • 僅能滿足 “=” 和 “IN”,不支援範圍查詢。
  • hash衝突問題。

Hash結構

可以看到 Hash 僅能滿足 “=” 和 “IN”,因為無序所以不支援範圍查詢,同時資料庫大資料儲存時容易產生 Hash 衝突,所以通常使用 B+tree。

五、MyISAM索引實現

雖然 MyISAM 在 MySQL8.0 中已經廢棄了,但是目前主流來說還是 MySQL5.7 的版本,所以還是說說 MyISAM 索引底層的資料結構。

首先需要 MySQL 安裝的客官看這兩篇:

小二使用的是 docker 安裝的方式,所以我的資料在 /itwxe/dockerData/mysql/data 目錄下。

小二建立了一個 blog_test 的資料庫,在裡面分表建了兩張表 test_innodb 和 test_myisam。

CREATE TABLE `test_innodb` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) NOT NULL,
  `age` int(11) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

CREATE TABLE `test_myisam` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) NOT NULL,
  `age` int(11) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4;

來磁碟上面看看 MySQL 是怎麼存放建立的庫和表的。

MySQL資料庫及表檔案存放位置及方式

InnoDB 儲存引擎兩個檔案分別儲存:

  • frm:表結構檔案
  • ibd:表索引及資料檔案

MyISAM 儲存引擎三個檔案分別儲存:

  • frm:表資料結構檔案
  • MYI:表索引檔案
  • MYD:表資料檔案

MyISAM 儲存引擎把索引檔案和資料檔案分開來存放,結構如圖。

MyISAM索引結構

MyISAM 儲存引擎索引同樣使用 B+tree,不過不同點在於沒有將資料儲存在葉子結點,葉子結點只儲存了所有的索引 + 資料檔案行記錄的磁碟地址。

六、InnoDB索引實現

InnoDB索引結構

前面已經看到了 InnoDB 的檔案儲存方式,與 MyISAM 不同的是,InnoDB 的索引和資料都放在葉子結點。

看完 InnoDB 儲存引擎的索引實現,來思考一個公司中 DBA 關於主鍵規定的問題。

通常公司 DBA 建議 InnoDB 表必須建主鍵,並且推薦使用整型的自增主鍵,這是為什麼呢?

  • 為什麼公司 DBA 建議 InnoDB 表必須建主鍵?
    • 表資料檔案本身就是按照 B+tree 組織的一個索引結構檔案,如果開發人員沒有建立主鍵,MySQL 會選擇唯一索引來作為主鍵索引構建索引資料檔案,如果沒有唯一索引會建立一個隱藏列來作為主鍵。
    • 那麼能自己完成的事情當然自己完成,同時使用主鍵來查詢單條記錄時可以避免回表,啥是回表看到二級索引及聯合索引實現就知道啦。
  • 為什麼推薦使用整型的自增主鍵?
    • 非整形主鍵下,例如 UUID,索引建立時比較大小問題(整形比較大小比UUID更快,UUID需要逐個字元轉換為 ASCII 碼逐個比較,雖然影響效能不大),同時非整形主鍵通常佔用的空間更大,也就意味著一個索引頁能夠存放的索引數量不如整形主鍵。
    • 非整形主鍵下,每次插入主鍵的值近似於隨機,因此每次新紀錄都要被插到現有索引頁得中間某個位置,那麼 MySQL 不得不為了將新記錄插到合適位置而移動資料,這增加了很多磁碟開銷;而使用整形自增主鍵情況下,資料只需要一直往葉子結點後面放即可,大大減少索引頁的分裂和移動資料產生的磁碟開銷。

七、二級索引及聯合索引實現

可以看到上面的圖都是以主鍵索引構建 B+tree,那麼二級索引和聯合索引是怎麼實現 B+tree 嘞,快跟著小二來瞅瞅。

1. 二級索引(輔助索引)

ALTER TABLE test_innodb ADD INDEX idx_name(name) USING BTREE; 為例,建立二級索引 B+tree。

二級索引(輔助索引)

二級索引在構建索引時葉子結點資料僅存放索引和主鍵 ID,並且以索引 name 欄位來排序作為葉子節點關鍵字,那麼例如要 SELECT * FROM test_innodb WHERE name = 'ITwxe'; ,那麼會怎麼查詢呢?

首先,會通過二級索引 idx_name(name) 查詢到 ITwxe,得到葉子結點主鍵 ID 為58後,會通過58去主鍵索引構建的 B+tree 中查詢所有欄位資訊,這也就是所謂的 回表

那麼非主鍵索引結構葉子節點都儲存完整的行記錄不是查詢更快嗎更快?為什麼 MySQL 非主鍵索引結構葉子節點儲存的是主鍵值去回表查詢,而不是儲存所有行欄位資訊呢?

  • 一致性問題,如果每個非主鍵索引葉子結點都儲存完整行記錄,那麼當更新一條記錄時,只有所有的索引中都更新成功這條記錄才能說這條記錄更新成功,增加了更新記錄時的複雜性和事務的開銷。
  • 磁碟佔用問題,如果每個非主鍵索引葉子結點都儲存完整行記錄,雖然速度會比回表查詢更快,但是有多少個索引就會有多少份完整資料,那麼原來佔用1GB大小的表,如果有4個非主鍵索引,那麼原來佔用1GB大小的表就會佔用5GB大小的磁碟,得不償失。

2. 聯合索引(複合索引)

同理,以 ALTER TABLE test_innodb ADD INDEX idex_name_age(name, age) USING BTREE; 為例,建立聯合索引 B+tree。

聯合索引(複合索引)

可以看到,聯合索引建立 B+tree 時,會以建立索引的順序來排列資料,首先以 name 欄位排序,再以 name 欄位來排序。name 欄位值如果相同,例如 Frank 那麼就會以 age 來排列順序,以此類推,最終同樣查到相應的主鍵 ID 之後回表到以主鍵構建的 B+tree 中查詢完整的行資訊。

看完聯合索引結構,想必客官已經知道最佳左字首原則是為什麼第一個欄位(name)一定要有才能生效了,因為只有第一個欄位相同,第二個欄位(age)才是有順序排列的。

同時如果同時存在兩個索引 idx_name(name)idex_name_age(name, age) ,那麼 idx_name(name) 即為冗餘索引,在建立索引時只需要建立聯合索引 idex_name_age(name, age),想必各位客官聰明的小腦袋對比一下兩個結構圖就知道啦~

3. 聚簇索引和稀疏索引

聚簇索引即葉子結點中包含所有完整行記錄,葉子節點中包含索引及其他所有欄位資訊,InnoDB 儲存引擎中以主鍵索引構建的 B+tree 即為聚簇索引,其他的皆為稀疏索引。例如二級索引、聯合索引、MyISAM儲存引擎的索引全是稀疏索引。

都讀到這裡了,來個 點贊、評論、關注、收藏 吧!

相關文章