Hadoop MapReduce架構簡介（初學學習不錯）

逸卿發表於2014-05-08

原文網址 : https://blog.csdn.net/yishao_20140413/article/details/25311001

MapReduce採用主從結構，JobTracker作為主節點，TaskTracker作為從節點。

其架構圖詳見圖1所示：

圖1 MapReduce架構圖

1、Client

使用者編寫的MapReduce程式通過Client提交到JobTracker端，還可通過Client提供的一些介面檢視作業的執行狀態。在Hadoop內部，用Job（作業）表示MapReduce程式。一個MapReduce程式對應若干個作業，而每個作業會被分解成若干個Map Task或Reduce Task。

2、JobTracker

JobTracker的職責：

接收客戶端提交的計算任務（Job）；

通過任務排程器（TaskSheduler）分配計算任務給TaskTracker執行；

監控所有TaskTracker與作業的健康狀況，當發現任務出現故障時，將相應的任務轉移到其他的節點。

打個比方，JobTracker相當於企業軟體開發的專案經理，主要負責各種資源的準備、排程和開發任務的分配。

3、TaskTracker

TaskTracker週期性的通過Heartbeat將本節點資源的使用情況和任務的執行進度彙報給JobTracker，同時接收JobTracker傳送過來的命令並執行相應的操作，如啟動新的任務、殺死作業等等。相對應的，TaskTracker相當於開發人員，主要執行專案經理分配的開發任務，並按時向專案經理彙報專案的開發進度。

4、Task

Task分為Map Task和Reduce Task兩種，都是由TaskTracker啟動。MapReduce的處理單位是split，它是一個邏輯概念（意味著實際上並沒有對資料切割），只包含一些後設資料資訊，如資料偏移量、資料長度等。Split的多少決定了Map Task的多少，因為每個split會交給一個Map Task處理。

Map Task的執行過程如下圖所示：

Map Task的執行過程：

Map Task先將對應的split迭代解析成一個個的<key,value>對，然後依次呼叫使用者自定義的map()方法進行處理，最終將臨時結果存放到本地磁碟上，其中，臨時結果被分成若干個partition，每個partition將被一個Reduce Task處理。

Reduce Task的執行過程如下圖所示：

Reduce Task的執行過程：

1）、從遠端節點上讀取Map Task中間結果，這是Shuffle階段；

2）、按照key對key/value pair進行排序，這是Sort階段；

3）、依次讀取<key, value list>，呼叫使用者自定義的reduce(）方法處理，

並最終的結果存到HDFS，這是Reduce階段。

Hadoop學習（二）——MapReduce\Yarn架構
2019-02-20
HadoopYarn架構
Hadoop學習——MapReduce
2019-04-06
Hadoop
Hadoop 學習系列（四）之 MapReduce 原理講解
2019-03-04
Hadoop
Hadoop之MapReduce2架構設計
2018-05-28
Hadoop架構
Hadoop學習第四天--MapReduce提交過程
2024-08-10
Hadoop
Hadoop學習筆記（1）：概念和整體架構
2019-01-23
Hadoop筆記架構
Android初級之路-Android系統架構簡介
2018-11-04
Android架構
Redis 學習-資料結構基本簡介
2020-04-27
Redis資料結構
初學 Android 架構元件之 Lifecycle
2019-02-24
Android架構元件
初學 Android 架構元件之 ViewModel
2019-02-24
Android架構元件View
Hadoop架構的初略總結（1）
2018-03-18
Hadoop架構
Hadoop架構的初略總結（2）
2018-03-18
Hadoop架構
codis架構學習
2024-06-30
架構
【機器學習】機器學習簡介
2018-11-29
機器學習
Hadoop學習
2024-07-30
Hadoop
隨機學習簡介
2024-04-13
隨機
Java學習：JDBC簡介
2019-08-22
JavaJDBC
機器學習簡介
2024-08-25
機器學習
強化學習-簡介
2021-01-20
強化學習
即學即會：初識 Serverless 架構
2022-03-21
Server架構
架構學習-多工
2024-04-13
架構
初學者入門大資料，學習Hadoop的5個理由
2018-09-02
大資料Hadoop
小白學習大資料測試之hadoop hdfs和MapReduce小實戰
2018-09-03
大資料Hadoop
初學者 | NLP相關任務簡介
2019-08-30
如何學習Hadoop
2020-11-05
Hadoop
Hadoop 簡介
2020-09-08
Hadoop
Hadoop簡介！
2019-07-09
Hadoop
Tensorflow 深度學習簡介（自用）
2018-09-20
深度學習
gcc簡介（學習筆記）
2020-10-04
GC筆記
元學習簡單介紹
2020-10-06
Unity學習系列一簡介
2019-02-07
Unity
3、Ktor學習-ApplicationCall簡介;
2019-03-04
APP
Hadoop 從 0 到 1 學習 ——第一章 Hadoop 介紹
2020-10-29
Hadoop
Java架構師如何學習?
2019-04-20
Java架構
架構演化學習思考(3)
2024-08-01
架構
軟體架構簡介
2018-06-17
架構
Web前端學習路線分享，初學者不要錯過！
2021-07-30
Web前端
[譯] 初創公司的資料科學：簡介
2019-03-04
資料科學
Hadoop的mapreduce出現問題，報錯The auxService:mapreduce_shuffle does not exist
2020-12-24
HadoopUX

Hadoop MapReduce架構簡介（初學學習不錯）

相關文章