理解HDFS高可用性架構

bzt820801發表於2017-08-21

在Hadoop1.x版本的時候，Namenode存在著單點失效的問題。如果namenode失效了，那麼所有的基於HDFS的客戶端——包括MapReduce作業均無法讀，寫或列檔案，因為namenode是唯一儲存後設資料與檔案到資料塊對映的地方。而從一個失效的namenode中恢復的步驟繁多，系統恢復時間太長，也會影響到日常的維護。

Hadoop的2.x版本在HDFS中增加了對高可用性的支援來解決單點失效的問題。

這一實現中簡單說就是配置了一對活動-備用namenode。當活動namenode失效的時候，備用namenode就會接管它的任務並開始服務於來自客戶端的請求，不會有任何明顯中斷。

下面我們來看一下HDFS實現高可用性的架構圖：

從架構圖我們可以看到：

Active NameNode 和 Standby NameNode：兩臺 NameNode 形成互備，一臺處於 Active 狀態，為主 NameNode，另外一臺處於 Standby 狀態，為備 NameNode，只有主 NameNode 才能對外提供讀寫服務。

主備切換控制器又稱故障轉移控制器，ZKFailoverController：ZKFailoverController 作為獨立的程式執行，對 NameNode 的主備切換進行總體控制。ZKFailoverController 能及時檢測到NameNode 的健康狀況，在主NameNode 故障時藉助 Zookeeper 實現自動的主備選舉和切換。

Zookeeper 叢集：為主備切換控制器提供主備選舉支援。

共享儲存系統：共享儲存系統是實現NameNode 的高可用最為關鍵的部分，共享儲存系統儲存了 NameNode 在執行過程中所產生的 HDFS 的後設資料。主NameNode和備NameNode 通過共享儲存系統實現後設資料同步。在進行主備切換的時候，新的主 NameNode 在確認後設資料完全同步之後才能繼續對外提供服務。

DataNode 節點：除了通過共享儲存系統共享 HDFS 的後設資料資訊之外，主 NameNode 和備 NameNode 還需要共享 HDFS 的資料塊和 DataNode 之間的對映關係。DataNode 會同時向主 NameNode 和備 NameNode 上報資料塊的位置資訊。

HDFS架構及原理
2019-03-23
架構
Hadoop的HDFS架構入門
2022-01-25
Hadoop架構
構建高可用性、高效能和可擴充套件的Zabbix Server架構
2024-07-01
套件Server架構
淺析HDFS架構和設計
2019-07-25
架構
淺談hdfs架構與資料流
2018-11-15
架構
hadoop 原始碼分析HDFS架構演進
2022-09-20
Hadoop原始碼架構
理解cassandra架構
2019-01-02
架構
重新理解架構
2022-11-22
架構
HDFS架構指南（分散式系統Hadoop的檔案系統架構）
2019-01-14
架構分散式Hadoop
HDFS1.x、2.x架構圖
2019-02-28
架構
Apache Hadoop文件翻譯之一（HDFS架構）
2018-09-29
ApacheHadoop架構
高可用架構
2024-09-14
架構
三層架構理解
2020-10-13
架構
MySQL 高可用架構之 MMM 架構
2019-08-12
MySql架構
分散式架構的高效能與可用性
2023-12-26
分散式架構
架構師眼中的高併發架構
2019-03-29
架構
高併發架構
2020-11-06
架構
springcloud技術架構理解
2020-10-21
SpringGCCloud架構
深入理解lambada架構
2024-06-07
架構
架構師眼裡的高併發架構
2018-07-27
架構
HDFS 09 - HDFS NameNode 的高可用機制
2021-08-22
5、pgpool-II高可用性（一）資料庫的高可用性
2020-12-01
資料庫
Tomcat 架構原理解析到架構設計借鑑
2020-12-05
Tomcat架構
NSX高階路由架構
2019-02-28
路由架構
Mysql高可用架構方案
2024-11-11
MySql架構
Canal高可用架構部署
2021-03-25
架構
powerVR tbdr 硬體架構理解
2019-03-02
VR架構
Kafka 概述：深入理解架構
2020-01-17
Kafka架構
如何理解多租戶架構？
2020-04-05
架構
理解Underscore的設計架構
2019-02-18
架構
NUMA架構的個人理解
2024-06-01
架構
換個角度，重新理解架構
2022-07-29
架構
Pfsense HA（高可用性群集）
2020-08-19
MySQL高可用架構之Keepalived+主從架構部署
2018-05-18
MySql架構
HDFS 01 - HDFS是什麼？它的適用場景有哪些？它的架構是什麼？
2021-02-18
架構
HDFS的機架感知策略
2020-06-15
【譯】理解Node事件驅動架構
2019-02-16
事件架構
理解本真的REST架構風格
2019-01-10
REST架構
理解索引：HBase介紹和架構
2018-06-07
索引架構

理解HDFS高可用性架構

相關文章