hadoop(5)--NameNode後設資料管理(2)
上次分享了寫資料的過程,那麼有個問題:NameNode是怎麼處理高併發的客戶端的請求的,NameNode響應為什麼這麼快?
帶著問題思考:①,如果資料放到記憶體中,那麼當斷電的時候,資料就沒有辦法恢復了,這一種肯定不是hdfs儲存資料,更不是NameNode儲存後設資料的策略
②,如果寫入硬碟,那怎麼可能響應快呢,這一種也pass
③,記憶體+硬碟【redis叢集資料也是這樣的,在分散式的檔案系統中這種思想是相通的】
那麼,畫一個圖來說明記憶體+硬碟的這種儲存策略
1,向NameNode申請寫資源
2,NameNode將資料暫時記錄到edits log中
3,NameNode返回可用的DataNode
4,客戶端向DataNode寫入檔案
5,客戶端通知NameNode已經寫完了
6,NameNode將之間記錄到edits log中的資料同步到記憶體中
這裡已經結束了,但是edits log如果滿了怎麼辦呢?
接下下就是NameNode的同步資料的問題,要保證在斷電的時候,資料可以完整的恢復?
當edits log檔案滿了【64M】或者是間隔3600秒,也就是1個小時,(這兩個引數都是可以配置的),就會進行合併,就是將edits log中的資料,追加到fsimage檔案之後,【這裡其實是產生了新的檔案,暫時可以理解為追加】,並把edits log中的資料清除。
這樣即使斷電可以一通過fsimage+edits log進行恢復,正常情況客戶端讀取的是記憶體中的資料,所以快,這就是高併發,響應支援的原因。
那麼NameNode是怎麼做到高可用的呢?這個問題留著明天分享,早早休息
望指正,不吝賜教!
相關文章
- Hadoop 之 NameNode 後設資料原理Hadoop
- Hadoop2之NameNode HA詳解Hadoop
- org.apache.hadoop.hdfs.server.namenode.NameNode.ApacheHadoopServer
- 2- hive後設資料與hadoop的關係HiveHadoop
- Hadoop錯誤之namenode當機的資料恢復Hadoop資料恢復
- 資料治理之後設資料管理
- Hadoop雙namenode配置搭建(HA)Hadoop
- Hadoop商業環境實戰-HDFS NameNode 當機後設資料一致保障及SNN機制深入研究Hadoop
- DevOps後設資料管理dev
- hadoop中namenode無法啟動Hadoop
- 資料治理之後設資料管理實踐
- 配置hadoop HIVE後設資料儲存在mysql中HadoopHiveMySql
- 圖形檔案後設資料管理工具exiv2
- Hadoop 啟動namenode節點失敗Hadoop
- 資料分析過程中後設資料該如何管理
- 資料服務基礎能力之後設資料管理
- Hadoop框架:NameNode工作機制詳解Hadoop框架
- Hadoop Namenode 無法啟動 總結一Hadoop
- 談談主動式後設資料管理
- Hadoop3.2.1 【 HDFS 】原始碼分析 : Standby Namenode解析Hadoop原始碼
- Hadoop中Namenode單點故障的解決方案Hadoop
- hadoop-叢集管理(2)——記憶體設定Hadoop記憶體
- 運維平臺的建設思考-後設資料管理運維
- 使用Atlas進行後設資料管理之Glossary
- SQL Server後設資料的管理與應用SQLServer
- 資料治理實踐:後設資料管理架構的演變架構
- 一文詳解後設資料管理與資料血緣
- Smartbi:資料治理系列之後設資料管理平臺的原理
- 資料治理--後設資料
- HADOOP遇到namenode: at org.apache.hadoop.net.NetUtils.createSocketAddr錯誤HadoopApache
- 運維平臺的建設思考-後設資料管理(五)運維
- 運維平臺的建設思考-後設資料管理(三)運維
- 運維平臺的建設思考-後設資料管理(四)運維
- 運維平臺的建設思考-後設資料管理(二)運維
- XML 程式設計思想:用 MusicBrainz 管理後設資料(轉)XML程式設計AI
- 黑猴子的家:Hadoop之Namenode多目錄配置Hadoop
- Hadoop3.2.1 【 HDFS 】原始碼分析 : Secondary Namenode解析Hadoop原始碼
- Hadoop之HDFS及NameNode單點故障解決方案Hadoop