面經手冊 · 第6篇《帶著面試題學習紅黑樹操作原理,解析什麼時候染色、怎麼進行旋轉、與2-3樹有什麼關聯》

小傅哥發表於2020-08-21


作者:小傅哥
部落格:https://bugstack.cn

沉澱、分享、成長,讓自己和他人都能有所收穫!?

一、前言

紅黑樹,是一種高效的自平衡二叉查詢樹

Rudolf Bayer 於1978年發明紅黑樹,在當時被稱為對稱二叉 B 樹(symmetric binary B-trees)。後來,在1978年被 Leo J. Guibas 和 Robert Sedgewick 修改為如今的紅黑樹

紅黑樹具有良好的效率,它可在近似O(logN) 時間複雜度下完成插入、刪除、查詢等操作,因此紅黑樹在業界也被廣泛應用,比如 Java 中的 TreeMap,JDK 1.8 中的 HashMap、C++ STL 中的 map 均是基於紅黑樹結構實現的。

死記硬背,很難學會

紅黑樹的結構和設計都非常優秀,也同樣在實現上有著複雜的處理邏輯,包括插入或者刪除節點時;顏色變化、旋轉操作等操作。但如果只把這些知識點硬背下來,什麼時候染色、什麼時候旋轉,是沒有多大意義的,用不了多久也就忘記了。所以這部分的學習,瞭解其根本更重要。

二、面試題

謝飛機,考你幾個紅黑樹的知識點?

  1. 紅黑樹的資料結構都用在哪些場景,有什麼好處?
  2. 紅黑樹的時間複雜度是多少?
  3. 紅黑樹中插入新的節點時怎麼保持平衡?

?飛機,2-3樹是不沒看,回去等訊息吧!

三、2-3樹與紅黑樹的等價性

在上一章節《講解2-3平衡樹「紅黑樹的前身」》,使用了大量圖例講解了2-3樹,並在標題處寫出它是紅黑樹的前身。閱讀後更容易理解紅黑樹相關知識。

紅黑樹規則

1. 根節點是黑色
2. 節點是紅黑或者黑色
3. 所有子葉節點都是黑色(葉子是NIL節點,預設沒有畫出來)
4. 每個紅色節點必須有兩個黑色子節點(也同樣說明一條鏈路上不能有鏈路的紅色節點)
5. 黑高,從任一節點到齊每個葉子節點,經過的路徑都包含相同數目的黑色節點

那麼,這些規則是怎麼總結定義出來的呢?接下里我們一步步分析講解。

1. 為什麼既有2-3樹要有紅黑樹

首先2-3樹(讀法:二三樹)就是一個節點有1個或者2個元素,而實際上2-3樹轉紅黑樹是由概念模型2-3-4樹轉換而來的。-4叉就是一個節點裡有3個元素,這在2-3樹中會被調整,但是在概念模型中是會被保留的。

雖然2-3-4樹也是具備2-3樹同樣的平衡樹的特性,但是如果直接把這樣的模型用程式碼實現就會很麻煩,且效率不高,這裡的複雜點包括;

  1. 2-叉、3-叉、4-叉,三種結構的節點型別,互相轉換複雜度較高
  2. 3-叉、4-叉,節點在資料比較上需要進行多次,不像2-叉節點,直接布林型別比較即可非左即右
  3. 程式碼實現上對每種差異,都需要有額外的程式碼,規則不夠標準化

所以,希望找到一種平衡關係,既保持2-3樹平衡和O(logn)的特性,又能在程式碼實現上更加方便,那麼就誕生了紅黑樹。

2. 簡單2-3樹轉紅黑樹

2-3樹轉紅黑樹,也可以說紅黑樹是2-3樹2-3-4樹的另外一種表現形式,也就是更利於編碼實現的形式。

簡單轉換示例;

2-叉、3-叉、4-叉,轉換紅黑樹示意圖

從上圖可以看出,2-3-4樹與紅黑樹的轉換關係,包括;

  1. 2-叉節點,轉換比較簡單,只是把原有節點轉換為黑色節點
  2. 3-叉節點,包括了2個元素,先用紅色線把兩個節點相連,之後拆分出來,最後調整高度黑色節點在上
  3. 4-叉節點,包括了3個元素,分別用紅黑線連線,之後拆分出來拉昇高度。這個拉昇過程和2-3樹調整一致,只是新增了顏色

綜上,就是2-3-4樹的節點轉換,總結出來的規則,如下;

  1. 將2-3-4樹,用二叉樹的形式表示
  2. 3-叉、4-叉節點,使用紅色、黑色連線進行連線
  3. 另外,3-叉節點有兩種情況,導致轉換成二叉樹,就有左傾和右傾

3. 複雜2-3樹轉紅黑樹

簡單2-3樹轉換紅黑樹的過程中,瞭解到一個基本的轉換規則右旋定義,接下來我們在一個稍微複雜一點的2-3樹與紅黑樹的對應關係,如下圖;

複雜2-3樹轉換紅黑樹

上圖是一個稍微複雜點的2-3樹,轉換為紅黑樹的過程,是不這樣一張圖讓你對紅黑樹更有感覺了,同時它也滿足一下條件;

  1. 從任意節點到葉子節點,所經過的黑色節點數目相同
  2. 黑色節點保持著整體的平衡性,也就是讓整個紅黑樹接近於O(logn)時間複雜度
  3. 其他紅黑樹的特點也都滿足,可以對照紅黑樹的特性進行比對

四、紅黑樹

1. 平衡操作

通過在上一章節2-3樹的學習,在插入節點時並不會插到空位置,而是與現有節點融合以及調整,保持整個樹的平衡。

而紅黑樹是2-3-4樹的一種概念模型轉換而來,在插入節點時通過紅色連結相連,也就是插入紅色節點。插入完成後進行調整,以保持樹接近平衡。

那麼,為了讓紅黑樹達到平衡狀態,主要包括染色、↔左右旋轉、這些做法其實都是從2-3樹演化過來的。接下來我們就分別講解幾種規則的演化過程,以此更好了解紅黑樹的平衡操作。

1.1 左旋轉

左旋定義: 把一個向右傾斜的紅節點連結(2-3樹,3-叉雙元素節點),轉化為左連結。

背景:順序插入元素,1、2、3,2-3樹保持平衡,紅黑樹暫時處於右傾斜。

接下來我們分別對比兩種樹結構的平衡操作;

  1. 2-3樹,所有插入的節點都會保持在一個節點上,之後通過調整節點位置,保持平衡。
  2. 紅黑樹,則需要通過節點的左側旋轉,將元素2拉起來,元素1和元素3,分別成為左右子節點。

紅黑樹的左旋,只會處理與之對應的2-3樹節點進行操作,不會整體改變。

1.2 右旋轉

右旋定義: 把一個向左傾斜的紅節點連線(2-3樹,3-叉雙元素節點),轉換為右連線。

背景:順序插入元素,3、1、1,2-3樹保持平衡,紅黑樹暫時處於左傾斜。

接下來我們分別對比兩種樹結構的平衡操作;

  1. 2-3樹,所有插入的節點都會保持在一個節點上,之後通過調整節點位置,保持平衡。
  2. 紅黑樹,則需要通過節點的右側旋轉,將元素2拉起來,元素1和元素3,分別成為左右子節點。

你會發現,左旋與右旋是相互對應的,但在2-3樹中是保持不變的

1.3 左右旋綜合運用

左旋、右旋,我們已經有了一個基本的概念,那麼接下來我們再看一個可以綜合左右旋以及對應2-3樹的演化案例,如下;

以上的例子分別演示了一個元素插入的三種情況,如下;

  1. 1、3,插入0,左側底部插入,與2-3樹相比,需要右旋保持平衡
  2. 1、3,插入2,中間位置插入,首先進行左旋調整元素位置,之後進行右旋進行樹平衡
  3. 1、3,插入5,右側位置插入,此時正好保持樹平衡,不需要調整

1.4 染色

在2-3樹中,插入一個節點,為了保持樹平衡是不插入到空位置上的,當插入節點後元素數量有3個後則需要調整中間元素向上,來保持樹平衡。與之對應的紅黑樹則需要調整顏色,來保證紅黑樹的平衡規則,具體參考如下;

2. 旋轉+染色運用案例

接下來我們把上面講解到的旋轉染色,運用到一個實際案例中,如下圖;

  • 首先從左側開始,是一個按照順序插入生產出來的紅黑樹,插入順序;7、2、8、1、4、3、5
  • α,向目前紅黑樹插入元素6,插入後右下角有三個紅色節點;3、5、6
  • β,因為右下角滿足染色條件,變換後;黑色節點(3、5)、紅色節點(4、6)。
  • γ,之後看被紅色連線連結的節點7、4、2,最小節點在中間,左旋平衡樹結構。
  • δ,左旋完成後,紅色連結線的7、4、2為做傾順序節點,因此需要做右旋操作。
  • ε,左旋、右旋,調整完成後,又滿足了染色操作。到此恢復紅黑樹平衡。

注意,所有連線紅色節點的,都是是紅色線。以此與2-3樹做對應。

3. 刪除操作

根據2-3-4樹模型的紅黑樹,在刪除的時候基本是按照2-3方式進行刪除,只不過在這個過程中需要染色和旋轉操作,以保持樹平衡。刪除過程主要可以分為如圖四種情況,如下;

3.1 刪除子葉紅色節點

紅色子葉節點的刪除並不會破壞樹平衡,也不影響樹高,所以直接刪除即可,如下;

3.2 刪除左側節點

3.2.1 被刪節點兄弟為黑色&含右子節點

3.2.2 被刪節點兄弟為黑色&含左子節點

3.2.3 被刪節點兄弟為黑色&含雙子節點(紅)

3.2.4 被刪節點兄弟為黑色&不含子節點

3.2.5 被刪節點兄弟為黑色&含雙黑節點(黑)

3.3. 刪除右側節點

3.3.1 被刪節點兄弟為黑色&含左子節點

3.3.2 被刪節點兄弟為黑色&含右子節點

3.3.3 被刪節點兄弟為黑色&含雙子節點(紅)

3.2.4 被刪節點兄弟為黑色&不含子節點

3.2.5 被刪節點兄弟為黑色&含雙黑節點(黑)

五、總結

  • 從2-3樹到解釋2-3-4樹概念推匯出紅黑樹,從元素的在2-3樹中的插入刪除對照到紅黑樹中保持平衡操作,從原理解析到各項情況實際操作等,以及把絕大部分紅黑樹內容全部介紹完成。
  • 紅黑樹的原理理解要比背概念更重要,這是一種資料結構的學習,更重要的是技術遷移學習,而不是為了面試背幾道題。可能這個學習過程非常燒腦,但適合學習根本。
  • 在編寫本篇文章時,參考了大量的資料進行校正,包括優秀文章;

六、系列推薦

相關文章