大資料入門：Hadoop Yarn元件基礎解析

加米穀大資料張老師發表於2020-11-26

原文網址 : https://blog.csdn.net/shuimuzh123/article/details/110198568

在Hadoop框架當中，Yarn元件是在Hadoop2.0之後的版本開始引入，主要是為了解決資源管理和排程的相關問題，是在大資料平臺的實際運用當中，根據實際需求而引入的解決方案。今天的大資料入門分享，我們就來對Hadoop Yarn元件做個簡單的基礎解析。

Yarn簡介

Yarn是Yet Another Resource Negotiator的縮寫，在Hadoop生態當中，作為通用的資源管理系統與排程平臺，去實現CPU、記憶體、磁碟、網路等資源進行統一管理與拆分，以容器的形式，為上層應用提供統一的資源服務。

Yarn主要包含四大元件，分別為ResourceManager、NodeManager、ApplicationMaster、Container。

Yarn核心概念

1、ResourceManager

ResourceManager是Yarn叢集的Master程式，主要負責整個叢集資源的統一管理和分配，當我們提交一個作業給Yarn，實際上就是提交給了ResourceManager，並由它協調分配相應的資源，這樣程式才能得以執行。

2、NodeManager

NodeManager是Yarn叢集的Slave程式，主要負責所在節點的資源和任務管理，它是每臺機器的框架代理，管理著容器的生命週期，監視其資源使用情況（CPU，記憶體，磁碟，網路）並將其報告給ResourceManager。

ResourceManager和NodeManager共同構成了資料計算框架，使Yarn具備了資源管理和協調能力。

3、ApplicationMaster

ApplicationMaster實際上是特定計算框架的一個例項，每種計算框架都有自己的ApplicationMaster實現，負責與ResourceManager協商資源，並和NodeManager協同來執行和監控Container。

4、Container

Container是一個動態資源分配單位，它將記憶體、CPU、磁碟、網路等資源封裝在一起，從而限定每個任務使用的資源量。ApplicationMaster和Container組成了分散式計算的框架基礎，分散式計算的程式碼就是在這二者程式內執行。

Yarn工作原理

Yarn的加入，彌補了經典Hadoop模型在擴充套件性，效率上和可用性等方面存在的明顯不足，可以說它是Apache對Hadoop1進行升級改造。

Yarn的引入主要兩個重要的變更：一個是HDFS的NameNode可以以叢集的方式部署，增強了NameNode水平的擴充套件能力和高可用性，分別是HDFS Federation與HA，二是MapReduce將Hadoop1時代的JobTracker中的資源管理和任務生命週期管理（包括定時觸發及監控），拆分兩個獨立的元件（Resource Manager和Application Master)，並更名為Yarn(yet Another Resource Negotiator)。

Yarn仍然是master/slave的架構，其中ResourceManager充當了master的角色，NodeManager充當了slave的角色，Resource Manager負責對多個NodeManager的資源進行統一管理和排程。

Yarn執行機制

由於Yarn並不清楚使用者提交的程式的執行機制，只提供運算資源的排程，Yarn其實就與執行的使用者程式完全解耦，就意味著Yarn上可以執行各種型別的分散式運算程式，包括Mapreduce、Storm、Spark……

Yarn就成為一個通用的資源排程平臺，企業中以前存在的各種運算叢集都可以整合在一個物理叢集上，提高資源利用率，方便資料共享Yarn工作機制。

關於大資料入門，Hadoop Yarn元件基礎解析，以上就為大家做了簡單的介紹了。Hadoop在大資料技術生態當中的重要性不言而喻，而Yarn作為Hadoop的核心元件之一，也需要重點掌握。

Hadoop 入門筆記—核心元件 YARN
2021-11-22
Hadoop筆記元件Yarn
hadoop大資料平臺安全基礎知識入門
2019-08-05
Hadoop大資料
Hadoop 基礎之 HDFS 入門
2019-05-13
Hadoop
大資料hadoop入門之hadoop家族產品詳解
2018-12-26
大資料Hadoop
Hadoop Yarn框架詳細解析
2019-01-07
HadoopYarn框架
Hadoop Yarn框架原理解析
2019-02-17
HadoopYarn框架
Hadoop基礎（二）：從Hadoop框架討論大資料生態
2020-07-11
Hadoop框架大資料
大資料學習：零基礎大資料入門該看哪些書？
2019-10-30
大資料
大資料零基礎由入門到實戰
2018-05-03
大資料
大資料分析入門基礎知識學什麼？
2023-12-06
大資料
教你零基礎如何快速入門大資料技巧
2019-05-12
大資料
入門大資料行業！必備的十大基礎
2019-05-19
大資料行業
大學剛畢業，零基礎大資料如何入門?
2019-05-27
大資料
Hadoop v3.1 大資料技術快速入門
2022-06-21
Hadoop大資料
大資料技術之Hadoop（入門）第1章大資料概論
2018-08-08
大資料Hadoop
大資料平臺基礎架構hadoop安全分析
2019-03-04
大資料架構Hadoop
大資料專欄 - 基礎1 Hadoop安裝配置
2021-01-10
大資料Hadoop
大資料技術之Hadoop（入門）第2章從Hadoop框架討論大資料生態
2018-08-08
大資料Hadoop框架
大資料系列零基礎由入門到實戰
2018-07-03
大資料
大資料零基礎入門需要多長時間？
2019-05-12
大資料
vue 基礎入門筆記 11:元件
2019-08-16
Vue筆記元件
資料分析 | 零基礎入門資料分析（一）：從入門到摔門？
2018-06-21
Hadoop大資料探勘從入門到進階實戰
2018-06-22
Hadoop大資料
Hadoop 入門筆記—核心元件 MapRuduce
2021-11-19
Hadoop筆記元件
Hadoop 入門筆記—核心元件 HDFS
2021-11-19
Hadoop筆記元件
Hadoop基礎入門之發行版本的選擇
2018-11-28
Hadoop
入門大資料開發行業！必備的十大基礎
2018-12-22
大資料行業
資料管理流程，基礎入門簡介
2020-12-08
有基礎學習大資料開發好不好入門
2021-03-22
大資料
大資料技術之Hadoop（入門）第3章 Hadoop執行環境搭建
2018-08-09
大資料Hadoop
大資料hadoop 新手快速入門經典視訊教程
2019-03-10
大資料Hadoop
大資料入門學習之Hadoop技術優缺點
2019-06-05
大資料Hadoop
大資料入門課程：Hadoop和spark的效能比較
2018-04-04
大資料HadoopSpark
Python Tkinter元件有哪些?Python基礎入門！
2021-05-21
Python元件
基於hadoop_yarn的資源隔離配置
2021-11-14
HadoopYarn
大資料基礎架構Hadoop，終於有人講明白了
2022-12-21
大資料架構Hadoop
零基礎入門學習大資料可以從事哪些工作？
2018-07-10
大資料
資料視覺化-svg入門基礎（二）
2019-05-20
視覺化SVG

大資料入門：Hadoop Yarn元件基礎解析

Yarn簡介

Yarn核心概念

Yarn工作原理

Yarn執行機制

相關文章