看圖輕鬆理解資料結構與演算法系列(B+樹)

超人汪小建發表於2018-09-06

原文網址 : https://juejin.im/post/5b9073f9f265da0acd209624

前言

推出一個新系列，《看圖輕鬆理解資料結構和演算法》，主要使用圖片來描述常見的資料結構和演算法，輕鬆閱讀並理解掌握。本系列包括各種堆、各種佇列、各種列表、各種樹、各種圖、各種排序等等幾十篇的樣子。

B+樹

B+樹是B樹的一種變體，也屬於平衡多路查詢樹，大體結構與B樹相同，包含根節點、內部節點和葉子節點。多用於資料庫和作業系統的檔案系統中，由於B+樹內部節點不儲存資料，所以能在記憶體中存放更多索引，增加快取命中率。另外因為葉子節點相連遍歷操作很方便，而且資料也具有順序性，便於區間查詢。

B+樹特點

B+樹可以定義一個m值作為預定範圍，即m路(階)B+樹。
根節點可能是葉子節點，也可能是包含兩個或兩個以上子節點的節點。
內部節點如果擁有k個關鍵字則有k+1個子節點。
非葉子節點不儲存資料，只儲存關鍵字用作索引，所有資料都儲存在葉子節點中。
非葉子節點有若干子樹指標，如果非葉子節點關鍵字為k1,k2,...kn，其中n=m-1，那麼第一個子樹關鍵字判斷條件為小於k1，第二個為大於等於k1而小於k2，以此類推，最後一個為大於等於kn，總共可以劃分出m個區間，即可以有m個分支。（判斷條件其實沒有嚴格的要求，只要能實現對B+樹的資料進行定位劃分即可，有些實現使用了m個關鍵字來劃分割槽間，也是可以的）
所有葉子節點通過指標鏈相連，且葉子節點本身按關鍵字的大小從小到大順序排列。
自然插入而不進行刪除操作時，葉子節點項的個數範圍為[floor(m/2),m-1]，內部節點項的個數範圍為[ceil(m/2)-1,m-1]。
另外通常B+樹有兩個頭指標，一個指向根節點一個指向關鍵字最小的葉子節點。
在進行刪除操作時，涉及到索引節點填充因子和葉子節點填充因子，一般可設葉子節點和索引節點的填充因子都不少於50%。

以下是一棵4階B+樹，

插入操作

假設現在構建一棵四階B+樹，開始插入“A”，直接作為根節點，

插入“B”，大於“A”，放右邊，

插入“C”，按順序排到最後，

繼續插入“D”，直接新增的結果如下圖，此時超過了節點可以存放容量，對於四階B+樹每個節點最多存放3個項，此時需要執行分裂操作，

分裂操作為，先選取待分裂節點中間位置的項，這裡選“C”，然後將“C”項放到父節點中，因為這裡還沒有父節點，那麼直接建立一個新的父節點存放“C”，而原來小於“C”的那些項作為左子樹，原來大於等於“C”的那些項作為右子樹。這裡注意下非葉子節點存放的都是關鍵字，用作索引的，所以父節點存放的“C”項不包括資料，資料仍然存放在右子樹。此外，還需要新增一個指標，由左子樹指向右子樹。