作者:小傅哥
部落格:https://bugstack.cn
沉澱、分享、成長,讓自己和他人都能有所收穫!?
一、前言
紅黑樹,是一種高效的自平衡二叉查詢樹
Rudolf Bayer 於1978年發明紅黑樹,在當時被稱為對稱二叉 B 樹(symmetric binary B-trees)
。後來,在1978年被 Leo J. Guibas 和 Robert Sedgewick 修改為如今的紅黑樹
。
紅黑樹具有良好的效率,它可在近似O(logN)
時間複雜度下完成插入、刪除、查詢等操作,因此紅黑樹在業界也被廣泛應用,比如 Java 中的 TreeMap,JDK 1.8 中的 HashMap、C++ STL 中的 map 均是基於紅黑樹結構實現的。
死記硬背,很難學會
紅黑樹的結構和設計都非常優秀,也同樣在實現上有著複雜的處理邏輯,包括插入或者刪除節點時;顏色變化、旋轉操作等操作。但如果只把這些知識點硬背下來,什麼時候染色、什麼時候旋轉,是沒有多大意義的,用不了多久也就忘記了。所以這部分的學習,瞭解其根本更重要。
二、面試題
謝飛機,考你幾個紅黑樹的知識點?
- 紅黑樹的資料結構都用在哪些場景,有什麼好處?
- 紅黑樹的時間複雜度是多少?
- 紅黑樹中插入新的節點時怎麼保持平衡?
?飛機,2-3樹是不沒看,回去等訊息吧!
三、2-3樹與紅黑樹的等價性
在上一章節《講解2-3平衡樹「紅黑樹的前身」》,使用了大量圖例講解了2-3樹,並在標題處寫出它是紅黑樹的前身。閱讀後更容易理解紅黑樹相關知識。
紅黑樹規則
1. 根節點是黑色
2. 節點是紅黑或者黑色
3. 所有子葉節點都是黑色(葉子是NIL節點,預設沒有畫出來)
4. 每個紅色節點必須有兩個黑色子節點(也同樣說明一條鏈路上不能有鏈路的紅色節點)
5. 黑高,從任一節點到齊每個葉子節點,經過的路徑都包含相同數目的黑色節點
那麼,這些規則是怎麼總結定義出來的呢?接下里我們一步步分析講解。
1. 為什麼既有2-3樹要有紅黑樹
首先2-3樹
(讀法:二三樹)就是一個節點有1個或者2個元素,而實際上2-3樹轉紅黑樹是由概念模型2-3-4樹
轉換而來的。-4叉
就是一個節點裡有3個元素,這在2-3樹中會被調整,但是在概念模型中是會被保留的。
雖然2-3-4樹
也是具備2-3樹
同樣的平衡樹的特性,但是如果直接把這樣的模型用程式碼實現就會很麻煩,且效率不高,這裡的複雜點包括;
- 2-叉、3-叉、4-叉,三種結構的節點型別,互相轉換複雜度較高
- 3-叉、4-叉,節點在資料比較上需要進行多次,不像2-叉節點,直接布林型別比較即可非左即右
- 程式碼實現上對每種差異,都需要有額外的程式碼,規則不夠標準化
所以,希望找到一種平衡關係,既保持2-3樹平衡和O(logn)的特性,又能在程式碼實現上更加方便,那麼就誕生了紅黑樹。
2. 簡單2-3樹轉紅黑樹
2-3樹
轉紅黑樹,也可以說紅黑樹是2-3樹
和2-3-4樹
的另外一種表現形式,也就是更利於編碼實現的形式。
簡單轉換示例;
從上圖可以看出,2-3-4樹與紅黑樹的轉換關係,包括;
- 2-叉節點,轉換比較簡單,只是把原有節點轉換為黑色節點
- 3-叉節點,包括了2個元素,先用紅色線把兩個節點相連,之後拆分出來,最後調整高度黑色節點在上
- 4-叉節點,包括了3個元素,分別用紅黑線連線,之後拆分出來拉昇高度。這個拉昇過程和2-3樹調整一致,只是新增了顏色
綜上,就是2-3-4樹的節點轉換,總結出來的規則,如下;
- 將2-3-4樹,用二叉樹的形式表示
- 3-叉、4-叉節點,使用紅色、黑色連線進行連線
- 另外,3-叉節點有兩種情況,導致轉換成二叉樹,就有左傾和右傾
3. 複雜2-3樹轉紅黑樹
在簡單2-3樹轉換紅黑樹
的過程中,瞭解到一個基本的轉換規則右旋定義,接下來我們在一個稍微複雜一點的2-3樹
與紅黑樹的對應關係,如下圖;
上圖是一個稍微複雜點的2-3樹,轉換為紅黑樹的過程,是不這樣一張圖讓你對紅黑樹更有感覺了,同時它也滿足一下條件;
- 從任意節點到葉子節點,所經過的黑色節點數目相同
- 黑色節點保持著整體的平衡性,也就是讓整個紅黑樹接近於O(logn)時間複雜度
- 其他紅黑樹的特點也都滿足,可以對照紅黑樹的特性進行比對
四、紅黑樹
1. 平衡操作
通過在上一章節2-3樹的學習,在插入節點時並不會插到空位置,而是與現有節點融合以及調整,保持整個樹的平衡。
而紅黑樹是2-3-4樹的一種概念模型轉換而來,在插入節點時通過紅色連結相連,也就是插入紅色節點。插入完成後進行調整,以保持樹接近平衡。
那麼,為了讓紅黑樹達到平衡狀態,主要包括染色、↔左右旋轉、這些做法其實都是從2-3樹演化過來的。接下來我們就分別講解幾種規則的演化過程,以此更好了解紅黑樹的平衡操作。
1.1 左旋轉
左旋定義: 把一個向右傾斜的紅節點連結(2-3樹,3-叉雙元素節點),轉化為左連結。
背景:順序插入元素,1、2、3,2-3樹保持平衡,紅黑樹暫時處於右傾斜。
接下來我們分別對比兩種樹結構的平衡操作;
- 2-3樹,所有插入的節點都會保持在一個節點上,之後通過調整節點位置,保持平衡。
- 紅黑樹,則需要通過節點的左側旋轉,將元素2拉起來,元素1和元素3,分別成為左右子節點。
紅黑樹的左旋,只會處理與之對應的2-3樹節點進行操作,不會整體改變。
1.2 右旋轉
右旋定義: 把一個向左傾斜的紅節點連線(2-3樹,3-叉雙元素節點),轉換為右連線。
背景:順序插入元素,3、1、1,2-3樹保持平衡,紅黑樹暫時處於左傾斜。
接下來我們分別對比兩種樹結構的平衡操作;
- 2-3樹,所有插入的節點都會保持在一個節點上,之後通過調整節點位置,保持平衡。
- 紅黑樹,則需要通過節點的右側旋轉,將元素2拉起來,元素1和元素3,分別成為左右子節點。
你會發現,左旋與右旋是相互對應的,但在2-3樹中是保持不變的
1.3 左右旋綜合運用
左旋、右旋,我們已經有了一個基本的概念,那麼接下來我們再看一個可以綜合左右旋以及對應2-3樹的演化案例,如下;
以上的例子分別演示了一個元素插入的三種情況,如下;
- 1、3,插入0,左側底部插入,與2-3樹相比,需要右旋保持平衡
- 1、3,插入2,中間位置插入,首先進行左旋調整元素位置,之後進行右旋進行樹平衡
- 1、3,插入5,右側位置插入,此時正好保持樹平衡,不需要調整
1.4 染色
在2-3樹中,插入一個節點,為了保持樹平衡是不插入到空位置上的,當插入節點後元素數量有3個後則需要調整中間元素向上,來保持樹平衡。與之對應的紅黑樹則需要調整顏色,來保證紅黑樹的平衡規則,具體參考如下;
2. 旋轉+染色運用案例
接下來我們把上面講解到的旋轉
、染色
,運用到一個實際案例中,如下圖;
- 首先從左側開始,是一個按照順序插入生產出來的紅黑樹,插入順序;
7、2、8、1、4、3、5
- α,向目前紅黑樹插入元素6,插入後右下角有三個紅色節點;
3、5、6
。 - β,因為右下角滿足染色條件,變換後;黑色節點(3、5)、紅色節點(4、6)。
- γ,之後看被紅色連線連結的節點
7、4、2
,最小節點在中間,左旋平衡樹結構。 - δ,左旋完成後,紅色連結線的
7、4、2
為做傾順序節點,因此需要做右旋操作。 - ε,左旋、右旋,調整完成後,又滿足了染色操作。到此恢復紅黑樹平衡。
注意,所有連線紅色節點的,都是是紅色線。以此與2-3樹做對應。
3. 刪除操作
根據2-3-4樹模型的紅黑樹,在刪除的時候基本是按照2-3方式進行刪除,只不過在這個過程中需要染色和旋轉操作,以保持樹平衡。刪除過程主要可以分為如圖四種情況,如下;
3.1 刪除子葉紅色節點
紅色子葉節點的刪除並不會破壞樹平衡,也不影響樹高,所以直接刪除即可,如下;
3.2 刪除左側節點
3.2.1 被刪節點兄弟為黑色&含右子節點
3.2.2 被刪節點兄弟為黑色&含左子節點
3.2.3 被刪節點兄弟為黑色&含雙子節點(紅)
3.2.4 被刪節點兄弟為黑色&不含子節點
3.2.5 被刪節點兄弟為黑色&含雙黑節點(黑)
3.3. 刪除右側節點
3.3.1 被刪節點兄弟為黑色&含左子節點
3.3.2 被刪節點兄弟為黑色&含右子節點
3.3.3 被刪節點兄弟為黑色&含雙子節點(紅)
3.2.4 被刪節點兄弟為黑色&不含子節點
3.2.5 被刪節點兄弟為黑色&含雙黑節點(黑)
五、總結
- 從2-3樹到解釋2-3-4樹概念推匯出紅黑樹,從元素的在2-3樹中的插入刪除對照到紅黑樹中保持平衡操作,從原理解析到各項情況實際操作等,以及把絕大部分紅黑樹內容全部介紹完成。
- 紅黑樹的原理理解要比背概念更重要,這是一種資料結構的學習,更重要的是技術遷移學習,而不是為了面試背幾道題。可能這個學習過程非常燒腦,但適合學習根本。
- 在編寫本篇文章時,參考了大量的資料進行校正,包括優秀文章;