HDFS的詳解(一)
-
三個程式
1)NameNode (NN): 名稱節點 --》client第一個操作的物件NameNode的功能: 檔案系統的名稱空間
1.檔名稱
2.檔案目錄結構
3.檔案的屬性(許可權 建立時間 副本數)
4.檔案對應哪些資料塊--》這些資料塊對應哪些DataNode節點上,不會持久化儲存這個對映關係,透過叢集的啟動和執行時,datanode定期傳送blockReport給NN,以此NN在【記憶體】中動態維護這種對映關係。
儲存: 維護檔案系統樹及整個樹內的所有檔案和目錄,這些資訊以兩種檔案形式永久儲存在本地磁碟上,名稱空間映象檔案fsimage+編輯日誌editlog
2)DataNode (DN): 資料節點 --》儲存資料的DataNode的作用:
1.每隔3秒傳送一次心跳 引數可配置 (預設)
2.每隔10次心跳傳送一次blockReport (30s)(預設)儲存: 資料塊+資料塊校驗,和與NN通訊
3)Secondary NameNode(SNN): 第二名稱節點Secondary NameNode的作用:
定期合併fsimage+editlog檔案為新的fsimage,推送給NN,稱為檢查點,checkpoint
儲存: 名稱空間映象檔案fsimage+編輯日誌editlog
引數:fs.checkpoint.period-->1h fs.checkpoint.size -->64M
2.block(資料塊)
大小: 64M 128M(目前2.x中預設)
引數: dfs.blocksize
3.副本數
dfs.replication : 3 一個塊會變為3個塊
案例
1個檔案130M : 128M 2M 兩個塊 預設塊大小為128M 實際儲存: 130M*3 多少個塊: 6
4.
副本放置策略
第一副本: 放置在上傳檔案的DataNode上;
如果是叢集外提交,則隨機挑選一臺磁碟
不太慢、 CPU不太忙的節點上;
第二副本: 放置在於第一個副本不同的機
架的節點上;
第三副本: 與第二個副本相同機架的不同
節點上;
如果還有更多的副本:隨機放在節
點中;
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31496956/viewspace-2199364/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- HDFS短路讀詳解
- HDFS balance策略詳解
- 詳解HDFS入門
- HDFS HA 高可用機制詳解
- Hadoop配置hdfs-site.xml詳解HadoopXML
- 圖文詳解 HDFS 的工作機制及其原理
- Logstash讀取Kafka資料寫入HDFS詳解Kafka
- Hadoop框架:HDFS讀寫機制與API詳解Hadoop框架API
- hadoop學習-HDFS的詳細概述Hadoop
- Hadoop HDFS(一)Hadoop
- 一文帶你瞭解HDFS技術
- HDFS原始碼解析系列一——HDFS通訊協議原始碼協議
- Hadoop入門(二)之 HDFS 詳細解析Hadoop
- Java的泛型詳解(一)Java泛型
- HDFS 05 - HDFS 常用的 Java API 操作JavaAPI
- Sequlize詳解(一)
- hibernate詳解一
- MyBatis詳解(一)MyBatis
- Hadoop 學習系列(二)之 HDFS 詳細解析Hadoop
- HDFS 09 - HDFS NameNode 的高可用機制
- 詳解Android中的四大元件之一:Activity詳解Android元件
- Android Service詳解(一)Android
- CTMediator 原理詳解(一)
- 閉包詳解一
- Promise用法詳解(一)Promise
- Spring Aop 詳解一Spring
- (一)hadoop叢集搭建——1.4hdfs的操作Hadoop
- 【史上最全】Hadoop 核心 - HDFS 分散式檔案系統詳解(上萬字建議收藏)Hadoop分散式
- 一文詳解Spring Boot的使用Spring Boot
- HDFS的PID整理
- HDFS 命令:用於管理HDFS的Hadoop Shell命令大全Hadoop
- HDFS 原始碼解讀:HadoopRPC 實現細節的探究原始碼HadoopRPC
- Flutter 動畫詳解(一)Flutter動畫
- 詳解NodeJs流之一NodeJS
- 虛擬Dom詳解 - (一)
- performance_schema詳解一ORM
- Flutter常用Widget詳解(一)Flutter
- Pytorch框架詳解之一PyTorch框架