HDFS的詳解（一）

laoma8888發表於2018-08-07

原文網址 : http://blog.itpub.net/31496956/viewspace-2199364/

三個程式
1)NameNode (NN): 名稱節點 --》client第一個操作的物件

NameNode的功能: 檔案系統的名稱空間
                              1.檔名稱
                              2.檔案目錄結構
                              3.檔案的屬性(許可權建立時間副本數)
                              4.檔案對應哪些資料塊--》這些資料塊對應哪些DataNode節點上,不會持久化儲存這個對映關係，透過叢集的啟動和執行時，datanode定期傳送blockReport給NN,以此NN在【記憶體】中動態維護這種對映關係。
儲存:   維護檔案系統樹及整個樹內的所有檔案和目錄，這些資訊以兩種檔案形式永久儲存在本地磁碟上,名稱空間映象檔案fsimage+編輯日誌editlog
2)DataNode (DN): 資料節點 --》儲存資料的

DataNode的作用:
   1.每隔3秒傳送一次心跳引數可配置（預設）
   2.每隔10次心跳傳送一次blockReport (30s)（預設）

儲存: 資料塊+資料塊校驗，和與NN通訊
3)Secondary NameNode(SNN): 第二名稱節點

Secondary NameNode的作用：

                           定期合併fsimage+editlog檔案為新的fsimage，推送給NN，稱為檢查點，checkpoint

                          儲存: 名稱空間映象檔案fsimage+編輯日誌editlog

引數:fs.checkpoint.period-->1h fs.checkpoint.size -->64M

2.block(資料塊)
大小: 64M 128M(目前2.x中預設)

引數: dfs.blocksize

3.副本數
dfs.replication : 3 一個塊會變為3個塊

案例
1個檔案130M : 128M 2M 兩個塊預設塊大小為128M 實際儲存: 130M*3 多少個塊: 6

4. 副本放置策略

第一副本：放置在上傳檔案的DataNode上;
如果是叢集外提交，則隨機挑選一臺磁碟
不太慢、 CPU不太忙的節點上;
第二副本：放置在於第一個副本不同的機
架的節點上;
第三副本：與第二個副本相同機架的不同
節點上;
如果還有更多的副本：隨機放在節點中;

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31496956/viewspace-2199364/，如需轉載，請註明出處，否則將追究法律責任。

相關文章

HDFS短路讀詳解
2019-06-04
HDFS balance策略詳解
2021-09-09
詳解HDFS入門
2021-04-27
HDFS HA 高可用機制詳解
2024-05-09
Hadoop配置hdfs-site.xml詳解
2024-03-14
HadoopXML
圖文詳解 HDFS 的工作機制及其原理
2022-05-19
Logstash讀取Kafka資料寫入HDFS詳解
2019-03-20
Kafka
Hadoop框架：HDFS讀寫機制與API詳解
2020-09-30
Hadoop框架API
hadoop學習-HDFS的詳細概述
2020-12-17
Hadoop
Hadoop HDFS(一)
2018-05-24
Hadoop
一文帶你瞭解HDFS技術
2022-01-10
HDFS原始碼解析系列一——HDFS通訊協議
2022-02-16
原始碼協議
Hadoop入門（二）之 HDFS 詳細解析
2018-09-11
Hadoop
Java的泛型詳解(一)
2020-05-20
Java泛型
HDFS 05 - HDFS 常用的 Java API 操作
2021-06-12
JavaAPI
Sequlize詳解（一）
2019-04-15
hibernate詳解一
2019-05-18
MyBatis詳解（一）
2022-11-27
MyBatis
Hadoop 學習系列（二）之 HDFS 詳細解析
2021-09-09
Hadoop
HDFS 09 - HDFS NameNode 的高可用機制
2021-08-22
詳解Android中的四大元件之一：Activity詳解
2018-08-07
Android元件
Android Service詳解(一)
2019-03-03
Android
CTMediator 原理詳解（一）
2019-01-07
閉包詳解一
2018-05-25
Promise用法詳解(一)
2018-08-08
Promise
Spring Aop 詳解一
2020-10-18
Spring
（一）hadoop叢集搭建——1.4hdfs的操作
2020-12-21
Hadoop
【史上最全】Hadoop 核心 - HDFS 分散式檔案系統詳解(上萬字建議收藏)
2021-02-08
Hadoop分散式
一文詳解Spring Boot的使用
2020-10-01
Spring Boot
HDFS的PID整理
2018-05-22
HDFS 原始碼解讀：HadoopRPC 實現細節的探究
2019-06-23
原始碼HadoopRPC
HDFS 命令：用於管理HDFS的Hadoop Shell命令大全
2021-12-29
Hadoop
Flutter 動畫詳解（一）
2019-03-04
Flutter動畫
詳解NodeJs流之一
2019-03-01
NodeJS
虛擬Dom詳解 - (一)
2019-08-07
performance_schema詳解一
2019-05-13
ORM
Flutter常用Widget詳解（一）
2019-02-18
Flutter
Pytorch框架詳解之一
2022-12-17
PyTorch框架