Zookeeper叢集節點數量為什麼要是奇數個?

@ 小浩發表於2018-10-07

無論是公司的生產環境,還是自己搭建的測試環境,Zookeeper叢集的節點個數都是奇數個。至於為什麼要是奇數個,以前只是模糊的知道是為了滿足選舉需要,並不知道詳細的原因。最近重點學習zookeeper,瞭解到其中的原理,現將其整理記錄下來。

首先需要明確zookeeper選舉的規則:leader選舉,要求 可用節點數量 > 總節點數量/2  。注意 是 > , 不是 ≥。

 

注:為什麼規則要求 可用節點數量 > 叢集總結點數量/2 ?  如果不這樣限制,在叢集出現腦裂的時候,可能會出現多個子叢集同時服務的情況(即子叢集各組選舉出自己的leader), 這樣對整個zookeeper叢集來說是紊亂的。

換句話說,如果遵守上述規則進行選舉,即使出現腦裂,叢集最多也只能回出現一個子叢集可以提供服務的情況(能滿足節點數量> 總結點數量/2 的子叢集最多隻會有一個)。所以要限制 可用節點數量 > 叢集總結點數量/2 。

 

採用奇數個的節點主要是出於兩方面的考慮:

1、防止由腦裂造成的叢集不可用。

首先,什麼是腦裂?叢集的腦裂通常是發生在節點之間通訊不可達的情況下,叢集會分裂成不同的小叢集,小叢集各自選出自己的master節點,導致原有的叢集出現多個master節點的情況,這就是腦裂。

下面舉例說一下為什麼採用奇數臺節點,就可以防止由於腦裂造成的服務不可用:

(1) 假如zookeeper叢集有 5 個節點,發生了腦裂,腦裂成了A、B兩個小叢集: 

     (a) A : 1個節點 ,B :4個節點 , 或 A、B互換

     (b) A : 2個節點, B :3個節點  , 或 A、B互換

    可以看出,上面這兩種情況下,A、B中總會有一個小叢集滿足 可用節點數量 > 總節點數量/2 。所以zookeeper叢集仍然能夠選舉出leader , 仍然能對外提供服務,只不過是有一部分節點失效了而已。

(2) 假如zookeeper叢集有4個節點,同樣發生腦裂,腦裂成了A、B兩個小叢集:

    (a) A:1個節點 ,  B:3個節點,   或 A、B互換 

    (b) A:2個節點 , B:2個節點

    可以看出,情況(a) 是滿足選舉條件的,與(1)中的例子相同。 但是情況(b) 就不同了,因為A和B都是2個節點,都不滿足 可用節點數量 > 總節點數量/2 的選舉條件, 所以此時zookeeper就徹底不能提供服務了。

綜合上面兩個例子可以看出: 在節點數量是奇數個的情況下, zookeeper叢集總能對外提供服務(即使損失了一部分節點);如果節點數量是偶數個,會存在zookeeper叢集不能用的可能性(腦裂成兩個均等的子叢集的時候)。

在生產環境中,如果zookeeper叢集不能提供服務,那將是致命的 , 所以zookeeper叢集的節點數一般採用奇數個。

2、在容錯能力相同的情況下,奇數臺更節省資源。

leader選舉,要求 可用節點數量 > 總節點數量/2  。注意 是 > , 不是 ≥。

舉兩個例子:

(1) 假如zookeeper叢集1 ,有3個節點,3/2=1.5 ,  即zookeeper想要正常對外提供服務(即leader選舉成功),至少需要2個節點是正常的。換句話說,3個節點的zookeeper叢集,允許有一個節點當機。

(2) 假如zookeeper叢集2,有4個節點,4/2=2 , 即zookeeper想要正常對外提供服務(即leader選舉成功),至少需要3個節點是正常的。換句話說,4個節點的zookeeper叢集,也允許有一個節點當機。

那麼問題就來了, 叢集1與叢集2都有 允許1個節點當機 的容錯能力,但是叢集2比叢集1多了1個節點。在相同容錯能力的情況下,本著節約資源的原則,zookeeper叢集的節點數維持奇數個更好一些。

 

參考連結:https://blog.csdn.net/u010476994/article/details/79806041

相關文章