Hadoop大資料開發框架學習
一.Hadoop框架介紹
hadoop是Apache釋出的開源分散式基礎架構
他的兩個核心是
- HDFS
HDFS是Hadoop的檔案管理系統,負責了海量資料的儲存,是做大資料的基礎 - MapReduce
MapReduce則是為了海量資料提供了計算
兩部分就組成了Hadoop的分散式基礎架構
二.HDFS介紹
HDFS作為Hadoop為儲存海量資料,自然有著與傳統檔案系統有著不同的結構,它是以Linux檔案系統的基礎的架構,構建裡一套分散式檔案系統,它是由一個NameNode和多臺DataNode組成的。
他通過將檔案進行劃分,分成多個資料塊進行儲存。(預設64MB,一般設定為128MB,備份X3)
NameNode
- 管理檔案系統的名稱空間,存放檔案後設資料
- 維護檔案系統的所有檔案和目錄,檔案與資料塊的對映
- 記錄每個檔案中各個塊所在資料節點的資訊
DataNode
- 儲存並檢索資料塊
- 香NameNode更新所儲存塊的列表
優點
- 適合大檔案儲存,有副本策略
- 可以構建在廉價機器上,有一定容錯和恢復機制
- 支援流式資料訪問,一次寫入多次讀取
缺點
- 不適合大量小檔案儲存
- 不適合併發寫入,不支援檔案隨機修改
- 不支援隨機讀等低延時的訪問方式
二.Yarn
yarn是Hadoop 中的資源管理器,MapReduce通過yarn來排程。
ResourceManager
- 分配和排程資源
- 啟動並監控ApplicationMaster
- 監控NodeManager
ApplicationMaster
- 為MapReduce型別程式申請資源,並分配給內部任務
- 負責資料的切分
- 監控任務的執行與容錯
NodeManager
- 管理單個節點的資源
- 處理來自ResourceManager的命令
- 處理來自ApplicationMaster的命令
四.MapReduce
MapReduce採用分而治之的程式設計思想
- 輸入一個大檔案,通過split之後,將其分為多個分片
- 每個檔案分片由單獨的機器去處理,這就是Map方法
- 將每個機器計算的結果進行彙總並得到最終的結果,這就是Reduce方法
相關文章
- 大資料框架之一——Hadoop學習第四天大資料框架Hadoop
- 大資料開發學習Hadoop路線圖(詳細篇)大資料Hadoop
- 想轉行大資料,如何開始學習 Hadoop?大資料Hadoop
- 大資料之 Hadoop學習筆記大資料Hadoop筆記
- 淺析大資料框架 Hadoop大資料框架Hadoop
- 大資料學習之Hadoop如何高效處理大資料大資料Hadoop
- 大資料和Hadoop什麼關係?為什麼大資料要學習Hadoop?大資料Hadoop
- 小白學習大資料測試之hadoop大資料Hadoop
- 大資料開發技術學習方向大資料
- 大資料Hadoop系統性學習路線圖大資料Hadoop
- 小白如何學習大資料開發,大資料學習路線是怎樣的?大資料
- ShifuML/shifu: Hadoop上的機器學習和資料探勘框架Hadoop機器學習框架
- 學會Java開發才能學習大資料嗎?Java大資料
- Hadoop系列002-從Hadoop框架討論大資料生態Hadoop框架大資料
- Hadoop基礎(二):從Hadoop框架討論大資料生態Hadoop框架大資料
- 零基礎大資料學習框架大資料框架
- 零基礎學習大資料Hadoop需要什麼準備?Hadoop如何發展起來的?大資料Hadoop
- 初學者入門大資料,學習Hadoop的5個理由大資料Hadoop
- 大資料技術之Hadoop(入門) 第2章 從Hadoop框架討論大資料生態大資料Hadoop框架
- 大資料hadoop資料大資料Hadoop
- 學習大資料必須瞭解的大資料開發課程大綱大資料
- 好程式設計師大資料學習路線Hadoop學習乾貨分享程式設計師大資料Hadoop
- 想自學大資料開發 鄭州大資料學習路線是什麼大資料
- Java軟體開發者,如何學習大資料?Java大資料
- 大資料入門學習之Hadoop技術優缺點大資料Hadoop
- 大資料開發需要學習什麼?大資料平臺是什麼?大資料
- 1.1 大資料簡介-hadoop-最全最完整的保姆級的java大資料學習資料大資料HadoopJava
- 寫給大資料初學者,從零開始學習大資料開發的完整路線大資料
- 大資料框架對比 - Hadoop、Spark、Storm、Samza、Spark、Flink大資料框架HadoopSparkORM
- 大資料學習筆記之Hadoop安裝步驟詳解大資料筆記Hadoop
- 大資料學習開發技術:MapReduce執行原理大資料
- Hadoop大資料部署Hadoop大資料
- 大資料hadoop工具大資料Hadoop
- 大資料學習資料大資料
- 大資料系統框架中hadoop服務角色介紹大資料框架Hadoop
- Hadoop大資料實戰系列文章之Mapreduce 計算框架Hadoop大資料框架
- 大資料學習大資料
- 小白學習大資料測試之hadoop hdfs和MapReduce小實戰大資料Hadoop