大資料小白系列——HDFS(4)

Morven.Huang發表於2018-12-29

大資料

這裡是大資料小白系列，這是本系列的第四篇，來看一個真實世界Hadoop叢集的規模，以及我們為什麼需要Hadoop Federation。

首先，我們先要來個直觀的印象，這是你以為的Hadoop叢集：

這是真實世界的Hadoop叢集：

因為，NameNode(下稱NN)中的後設資料記錄了各個資料塊的儲存位置。

所以，後設資料的大小，與資料塊的數量成正比。

當叢集儲存的資料規模到達一定程度時，NN將成為整套系統中的瓶頸所在。NN的儲存能力是有限的，不管是磁碟儲存還是記憶體儲存。

為了解決這個問題，HDFS中引入了聯邦(Federation)的概念。

聯邦：由若干具有國家性質的行政區域（有國、邦、州等不同名稱）聯合而成的統一國家，各行政區域有自己的憲法、立法機關和政府，聯邦也有統一的憲法、立法機關和政府。—— 維基百科

體現在HDFS上，就是“集權”到“分權”的過程，引入了多對NN(Active NN + Standby NN這裡稱為一對)，讓他們各自實現“區域自治”。

物理上是這樣的，所有的DN(DataNode)需向所有的NN彙報狀態。

邏輯上是這樣的，一對NN只負責管理屬於自己名稱空間下的目錄。

因此，並不是某對NN管理某些DN，而是對HDFS進行劃分，即邏輯劃分。

上面這樣規模的叢集，有可能劃分出數十個“邦”，各自管理“邦”內的資料，這樣就基本實現了NN的水平擴充套件，同時，還對提高整個系統的可用性有幫助，畢竟，某一對NN當機，只會對系統產生區域性影響。

注：HDFS聯邦並不強制要求各NN都做HA，只是通常是這樣配置的，即每個“邦”的NN都是成對出現的。

好了，關於HDFS的所有介紹就先到這，那些沒講到的，都不重要(誤)，下期我們將開始介紹新的內容：MapReduce的基本概念。Cheers!

公眾號程式設計師雜書館，大資料內容持續更新中，歡迎關注！

大資料小白系列——HDFS(1)
2018-12-09
大資料
大資料小白系列——HDFS(2)
2018-12-15
大資料
大資料小白系列——HDFS(3)
2018-12-20
大資料
大資料小白系列——MR(1)
2019-01-03
大資料
大資料小白系列——MR(3)
2018-12-31
大資料
大資料系列2：Hdfs的讀寫操作
2021-01-26
大資料
大資料系列1：一文初識Hdfs
2021-01-25
大資料
IT十年-大資料系列講解之HDFS（二）
2018-04-09
大資料
Hadoop系列之HDFS 資料塊
2022-01-19
Hadoop
小白學習大資料測試之hadoop hdfs和MapReduce小實戰
2018-09-03
大資料Hadoop
大資料小白系列 —— MapReduce流程的深入說明
2019-03-16
大資料
Hadoop大資料實戰系列文章之HDFS檔案系統
2020-11-06
Hadoop大資料
大資料系列4：Yarn以及MapReduce 2
2021-01-29
大資料Yarn
大資料3-Flume收集資料+落地HDFS
2018-04-02
大資料
小白學python系列-(4)list
2018-04-06
Python
資料結構小白系列之資料結構概述
2019-03-05
資料結構
大資料：小白升級版
2018-04-25
大資料
大資料檔案儲存系統HDFS
2019-01-15
大資料
大資料 | 分散式檔案系統 HDFS
2021-07-09
大資料分散式
【大資料】【hadoop】檢視hdfs檔案命令
2020-11-29
大資料Hadoop
HDFS資料平衡
2022-06-30
小白系列：資料庫基礎知識解析
2024-08-19
資料庫
大資料謝列3：Hdfs的HA實現
2021-01-27
大資料
MySQL系列教程小白資料庫基礎暨隨
2022-03-01
MySql資料庫
09 大資料之Hadoop(第四部 HDFS)
2020-11-01
大資料Hadoop
大資料2-Hadoop偽分散式+ZK+HDFS
2018-04-01
大資料Hadoop分散式
大資料教程系列之大資料概念
2020-05-29
大資料
小白學習大資料測試之hadoop
2018-09-02
大資料Hadoop
4、hdfs api使用
2018-07-23
API
Router-Based HDFS Federation 在滴滴大資料的應用
2019-01-11
大資料
大資料專案實踐（一）——之HDFS叢集配置
2018-08-21
大資料
大資料為什麼這麼火？小白該如何去學習大資料
2018-11-18
大資料
HDFS 05 - HDFS 的後設資料管理（FSImage、EditLog、Checkpoint）
2021-06-06
從 RAID 到 Hadoop Hdfs 『大資料儲存的進化史』
2018-12-18
AIHadoop大資料
好程式設計師大資料培訓分享HDFS讀流程
2020-06-15
程式設計師大資料
好程式設計師大資料教程分享：HDFS基本概念
2019-07-09
程式設計師大資料
雲上大資料儲存：探究 JuiceFS 與 HDFS 的異同
2023-04-04
大資料UI
大資料系列 1：大資料技術發展歷程
2018-12-30
大資料

大資料小白系列——HDFS(4)

相關文章