hadoop(5)--NameNode後設資料管理(2)
上次分享了寫資料的過程,那麼有個問題:NameNode是怎麼處理高併發的客戶端的請求的,NameNode響應為什麼這麼快?
帶著問題思考:①,如果資料放到記憶體中,那麼當斷電的時候,資料就沒有辦法恢復了,這一種肯定不是hdfs儲存資料,更不是NameNode儲存後設資料的策略
②,如果寫入硬碟,那怎麼可能響應快呢,這一種也pass
③,記憶體+硬碟【redis叢集資料也是這樣的,在分散式的檔案系統中這種思想是相通的】
那麼,畫一個圖來說明記憶體+硬碟的這種儲存策略
1,向NameNode申請寫資源
2,NameNode將資料暫時記錄到edits log中
3,NameNode返回可用的DataNode
4,客戶端向DataNode寫入檔案
5,客戶端通知NameNode已經寫完了
6,NameNode將之間記錄到edits log中的資料同步到記憶體中
這裡已經結束了,但是edits log如果滿了怎麼辦呢?
接下下就是NameNode的同步資料的問題,要保證在斷電的時候,資料可以完整的恢復?
當edits log檔案滿了【64M】或者是間隔3600秒,也就是1個小時,(這兩個引數都是可以配置的),就會進行合併,就是將edits log中的資料,追加到fsimage檔案之後,【這裡其實是產生了新的檔案,暫時可以理解為追加】,並把edits log中的資料清除。
這樣即使斷電可以一通過fsimage+edits log進行恢復,正常情況客戶端讀取的是記憶體中的資料,所以快,這就是高併發,響應支援的原因。
那麼NameNode是怎麼做到高可用的呢?這個問題留著明天分享,早早休息
望指正,不吝賜教!
相關文章
- Hadoop2之NameNode HA詳解Hadoop
- 2- hive後設資料與hadoop的關係HiveHadoop
- Hadoop錯誤之namenode當機的資料恢復Hadoop資料恢復
- Hadoop雙namenode配置搭建(HA)Hadoop
- Hadoop商業環境實戰-HDFS NameNode 當機後設資料一致保障及SNN機制深入研究Hadoop
- DevOps後設資料管理dev
- 資料治理之後設資料管理
- Hadoop 啟動namenode節點失敗Hadoop
- Hadoop框架:NameNode工作機制詳解Hadoop框架
- 資料治理之後設資料管理實踐
- Hadoop3.2.1 【 HDFS 】原始碼分析 : Secondary Namenode解析Hadoop原始碼
- Hadoop3.2.1 【 HDFS 】原始碼分析 : Standby Namenode解析Hadoop原始碼
- Hadoop中Namenode單點故障的解決方案Hadoop
- 資料資產管理:模型後設資料需要包含哪些要素?模型
- 資料分析過程中後設資料該如何管理
- 資料服務基礎能力之後設資料管理
- 談談主動式後設資料管理
- 黑猴子的家:Hadoop之Namenode多目錄配置Hadoop
- 使用Atlas進行後設資料管理之Glossary
- Windows下hadoop環境搭建之NameNode啟動報錯WindowsHadoop
- 一文詳解後設資料管理與資料血緣
- Smartbi:資料治理系列之後設資料管理平臺的原理
- 資料治理實踐:後設資料管理架構的演變架構
- 資料治理之後設資料管理的利器——Atlas入門寶典
- 資料治理--後設資料
- 大資料hadoop資料大資料Hadoop
- HDFS 05 - HDFS 的後設資料管理(FSImage、EditLog、Checkpoint)
- 黑猴子的家:Hadoop NameNode 高可用 (High Availability) 實現解析HadoopAI
- 大資料技術之Hadoop(入門) 第2章 從Hadoop框架討論大資料生態大資料Hadoop框架
- Hadoop資料模型Hadoop模型
- EasyMR 安全架構揭秘:如何管理 Hadoop 資料安全架構Hadoop
- Hadoop原始碼:namenode格式化和啟動過程實現Hadoop原始碼
- Hadoop資料傳輸:如何將資料移入和移出Hadoop?Hadoop
- 大資料2-Hadoop偽分散式+ZK+HDFS大資料Hadoop分散式
- Hadoop高階資料分析 使用Hadoop生態系統設計和構建大資料系統Hadoop大資料
- PowerDesigner 業務流程/資料建模軟體和後設資料管理解決方案
- 如何進行投後資料管理?Smartbi投後資料管理平臺來幫你
- 基於TableStore的海量電商訂單後設資料管理