Hadoop大資料開發框架學習
一.Hadoop框架介紹
hadoop是Apache釋出的開源分散式基礎架構
他的兩個核心是
- HDFS
HDFS是Hadoop的檔案管理系統,負責了海量資料的儲存,是做大資料的基礎 - MapReduce
MapReduce則是為了海量資料提供了計算
兩部分就組成了Hadoop的分散式基礎架構
二.HDFS介紹
HDFS作為Hadoop為儲存海量資料,自然有著與傳統檔案系統有著不同的結構,它是以Linux檔案系統的基礎的架構,構建裡一套分散式檔案系統,它是由一個NameNode和多臺DataNode組成的。
他通過將檔案進行劃分,分成多個資料塊進行儲存。(預設64MB,一般設定為128MB,備份X3)
NameNode
- 管理檔案系統的名稱空間,存放檔案後設資料
- 維護檔案系統的所有檔案和目錄,檔案與資料塊的對映
- 記錄每個檔案中各個塊所在資料節點的資訊
DataNode
- 儲存並檢索資料塊
- 香NameNode更新所儲存塊的列表
優點
- 適合大檔案儲存,有副本策略
- 可以構建在廉價機器上,有一定容錯和恢復機制
- 支援流式資料訪問,一次寫入多次讀取
缺點
- 不適合大量小檔案儲存
- 不適合併發寫入,不支援檔案隨機修改
- 不支援隨機讀等低延時的訪問方式
二.Yarn
yarn是Hadoop 中的資源管理器,MapReduce通過yarn來排程。
ResourceManager
- 分配和排程資源
- 啟動並監控ApplicationMaster
- 監控NodeManager
ApplicationMaster
- 為MapReduce型別程式申請資源,並分配給內部任務
- 負責資料的切分
- 監控任務的執行與容錯
NodeManager
- 管理單個節點的資源
- 處理來自ResourceManager的命令
- 處理來自ApplicationMaster的命令
四.MapReduce
MapReduce採用分而治之的程式設計思想
- 輸入一個大檔案,通過split之後,將其分為多個分片
- 每個檔案分片由單獨的機器去處理,這就是Map方法
- 將每個機器計算的結果進行彙總並得到最終的結果,這就是Reduce方法
相關文章
- 大資料開發學習Hadoop路線圖(詳細篇)大資料Hadoop
- 想轉行大資料,如何開始學習 Hadoop?大資料Hadoop
- 大資料之 Hadoop學習筆記大資料Hadoop筆記
- 大資料學習之Hadoop如何高效處理大資料大資料Hadoop
- 淺析大資料框架 Hadoop大資料框架Hadoop
- 大資料開發技術學習方向大資料
- 小白如何學習大資料開發,大資料學習路線是怎樣的?大資料
- 小白學習大資料測試之hadoop大資料Hadoop
- 學會Java開發才能學習大資料嗎?Java大資料
- 大資料和Hadoop什麼關係?為什麼大資料要學習Hadoop?大資料Hadoop
- 大資料學習筆記(十五)-大資料排程框架大資料筆記框架
- 零基礎大資料學習框架大資料框架
- 【整理】Hadoop學習資料Hadoop
- 學習大資料必須瞭解的大資料開發課程大綱大資料
- 大資料Hadoop系統性學習路線圖大資料Hadoop
- 大資料學習之--hadoop2.7.3環境搭建大資料Hadoop
- 大資料開發需要學習什麼?大資料平臺是什麼?大資料
- 大資料學習開發技術:MapReduce執行原理大資料
- 想自學大資料開發 鄭州大資料學習路線是什麼大資料
- 寫給大資料初學者,從零開始學習大資料開發的完整路線大資料
- 大資料學習資料大資料
- 好程式設計師大資料學習路線Hadoop學習乾貨分享程式設計師大資料Hadoop
- 零基礎學習大資料Hadoop需要什麼準備?Hadoop如何發展起來的?大資料Hadoop
- 大資料學習大資料
- 1.1 大資料簡介-hadoop-最全最完整的保姆級的java大資料學習資料大資料HadoopJava
- 精心收集的Hadoop學習資料Hadoop
- Hadoop學習筆記—17.Hive框架學習Hadoop筆記Hive框架
- 大資料入門學習之Hadoop技術優缺點大資料Hadoop
- 初學者入門大資料,學習Hadoop的5個理由大資料Hadoop
- Hadoop基礎(二):從Hadoop框架討論大資料生態Hadoop框架大資料
- 大資料時代之hadoop(五):hadoop 分散式計算框架(MapReduce)大資料Hadoop分散式框架
- 大資料hadoop資料大資料Hadoop
- 大資料技術之Hadoop(入門) 第2章 從Hadoop框架討論大資料生態大資料Hadoop框架
- 大資料學習,大資料發展趨勢和Spark介紹大資料Spark
- 大資料開發培訓班需要學習多長時間?大資料
- 有基礎學習大資料開發好不好入門大資料
- Hadoop系列002-從Hadoop框架討論大資料生態Hadoop框架大資料
- DKHadoop大資料開發框架的構成模組Hadoop大資料框架