Spark學習（一）——執行模式與執行流程

Hiway發表於2019-03-31

原文網址 : https://juejin.im/post/5c9d8bf85188251d72712f51

Spark模式

其他更多java基礎文章：
java基礎學習(目錄)

概述

Spark，是一種通用的大資料計算框架，正如傳統大資料技術Hadoop的MapReduce和Storm流式實時計算引擎等。
Spark包含了大資料領域常見的各種計算框架，比如:

Spark Core用於離線計算
Spark SQL用於互動式查詢
Spark Streaming用於實時流式計算
Spark MLlib用於機器學習
Spark GraphX用於圖計算

Spark VS MapReduce

這部分由於水平有限，只能轉至其他大神的總結

www.cnblogs.com/deadend/p/6…
blog.csdn.net/wyz05160711…

簡單總結一下：

Spark提供了記憶體計算，可將中間結果放到記憶體中，對於迭代運算效率更高
Spark基於DAG的任務排程執行機制，要優於Hadoop MapReduce的迭代執行機制
使用多執行緒池模型來減少task啟動開稍，shuffle過程中避免不必要的sort操作以及減少磁碟IO操作，而MapReduce使用多程式模型
Spark提供了多種語言支援，特別是scala，方便易用

Spark重點概念

Application: Appliction都是指使用者編寫的Spark應用程式，其中包括一個Driver功能的程式碼和分佈在叢集中多個節點上執行的Executor程式碼
Driver: Spark中的Driver即執行上述Application的main函式並建立SparkContext，建立SparkContext的目的是為了準備Spark應用程式的執行環境，在Spark中有SparkContext負責與ClusterManager通訊，進行資源申請、任務的分配和監控等，當Executor部分執行完畢後，Driver同時負責將SparkContext關閉，通常用SparkContext代表Driver
Executor: 某個Application執行在worker節點上的一個程式，該程式負責執行某些Task，並且負責將資料存到記憶體或磁碟上，每個Application都有各自獨立的一批Executor，在Spark on Yarn模式下，其程式名稱為CoarseGrainedExecutor Backend。一個CoarseGrainedExecutor Backend有且僅有一個Executor物件，負責將Task包裝成taskRunner,並從執行緒池中抽取一個空閒執行緒執行Task，這個每一個CoarseGrainedExecutor Backend能並行執行Task的數量取決與分配給它的cpu個數
Cluter Manager：指的是在叢集上獲取資源的外部服務。目前有三種型別
- Standalon : spark原生的資源管理，由Master負責資源的分配
- Apache Mesos:與hadoop MR相容性良好的一種資源排程框架
- Hadoop Yarn: 主要是指Yarn中的ResourceManager
Worker: 叢集中任何可以執行Application程式碼的節點，在Standalone模式中指的是通過slave檔案配置的Worker節點，在Spark on Yarn模式下就是NodeManager節點
Task: 被送到某個Executor上的工作單元，和hadoopMR中的MapTask和ReduceTask概念一樣，是執行Application的基本單位，多個Task組成一個Stage，而Task的排程和管理等是由TaskScheduler負責
Job: 包含多個Task組成的平行計算，往往由Spark Action觸發生成， 一個Application中往往會產生多個Job
Stage: 每個Job會被拆分成多組Task，作為一個TaskSet，其名稱為Stage，Stage的劃分和排程是有DAGScheduler來負責的，Stage有非最終的Stage（Shuffle Map Stage）和最終的Stage（Result Stage）兩種，Stage的邊界就是發生shuffle的地方
DAGScheduler: 根據Job構建基於Stage的DAG（Directed Acyclic Graph有向無環圖)，並提交Stage給TASkScheduler。其劃分Stage的依據是RDD之間的依賴的關係找出開銷最小的排程方法，如下圖

TASKSedulter: 將TaskSET提交給worker執行，每個Executor執行什麼Task就是在此處分配的. TaskScheduler維護所有TaskSet，當Executor向Driver發生心跳時，TaskScheduler會根據資源剩餘情況分配相應的Task。另外TaskScheduler還維護著所有Task的執行標籤，重試失敗的Task。下圖展示了TaskScheduler的作用

在不同執行模式中任務排程器具體為：
- Spark on Standalone模式為TaskScheduler
- YARN-Client模式為YarnClientClusterScheduler
- YARN-Cluster模式為YarnClusterScheduler 將這些術語串起來的執行層次圖如下：

簡單總結：Job=多個stage，Stage=多個同種task, Task分為ShuffleMapTask和ResultTask，Dependency分為ShuffleDependency(寬依賴)和NarrowDependency(窄依賴)

ResultTask：對於 DAG 圖中最後一個 Stage（也就是 ResultStage），會生成與該 DAG 圖中哦最後一個 RDD （DAG 圖中最後邊）partition 個數相同的 ResultTask

ShuffleMapTask：對於非最後的 Stage（也就是 ShuffleMapStage），會生成與該 Stage 最後的 RDD partition 個數相同的 ShuffleMapTask

Spark執行模式

Spark的執行模式多種多樣，靈活多變，部署在單機上時，既可以用本地模式執行，也可以用偽分佈模式執行，而當以分散式叢集的方式部署時，也有眾多的執行模式可供選擇，這取決於叢集的實際情況，底層的資源排程即可以依賴外部資源排程框架，主要有以下3種：

local本地模式
Spark內建的Standalone模式。
Spark on Yarn模式
Spark on mesos模式

local模式

此種模式下，我們只要將Spark包解壓即可使用，執行時Spark目錄下的bin目錄執行bin/spark-shell即可，適合自己練習以及測試的情況。

Spark執行模式（一）－－－－－Spark獨立模式

Standalone模式

Spark(一): 基本架構及原理

Standalone模式使用Spark自帶的資源排程框架
採用Master/Slaves的典型架構，選用ZooKeeper來實現Master的HA
框架結構圖如下:

該模式主要的節點有Client節點、Master節點和Worker節點。其中Driver既可以執行在Master節點上中，也可以執行在本地Client端。當用spark-shell互動式工具提交Spark的Job時，Driver在Master節點上執行；當使用spark-submit工具提交Job或者在Eclips、IDEA等開發平臺上使用”new SparkConf.setManager(“spark://master:7077”)”方式執行Spark任務時，Driver是執行在本地Client端上的執行過程如下圖：

SparkContext連線到Master，向Master註冊並申請資源（CPU Core 和Memory）
Master根據SparkContext的資源申請要求和Worker心跳週期內報告的資訊決定在哪個Worker上分配資源，然後在該Worker上獲取資源，然後啟動StandaloneExecutorBackend；
StandaloneExecutorBackend向SparkContext註冊；
SparkContext將Applicaiton程式碼傳送給StandaloneExecutorBackend；並且SparkContext解析Applicaiton程式碼，構建DAG圖，並提交給DAG Scheduler分解成Stage（當碰到Action操作時，就會催生Job；每個Job中含有1個或多個Stage，Stage一般在獲取外部資料和shuffle之前產生），然後以Stage（或者稱為TaskSet）提交給Task Scheduler，Task Scheduler負責將Task分配到相應的Worker，最後提交給StandaloneExecutorBackend執行；
StandaloneExecutorBackend會建立Executor執行緒池，開始執行Task，並向SparkContext報告，直至Task完成
所有Task完成後，SparkContext向Master登出，釋放資源

Spark on Yarn模式

Yarn的基本框架可以閱讀前面的文章Hadoop學習（二）——MapReduce\Yarn架構。
Spark on YARN模式根據Driver在叢集中的位置分為兩種模式：一種是YARN-Client模式，另一種是YARN-Cluster（或稱為YARN-Standalone模式）。

Yarn Client模式

Yarn-Client模式中，Driver在客戶端本地執行，這種模式可以使得Spark Application和客戶端進行互動，因為Driver在客戶端，所以可以通過webUI訪問Driver的狀態，預設是http://hadoop1:4040訪問，而YARN通過http:// hadoop1:8088訪問
YARN-client的工作流程步驟為：

Spark Yarn Client向YARN的ResourceManager申請啟動Application Master。同時在SparkContent初始化中將建立DAGScheduler和TASKScheduler等，由於我們選擇的是Yarn-Client模式，程式會選擇YarnClientClusterScheduler和YarnClientSchedulerBackend
ResourceManager收到請求後，在叢集中選擇一個NodeManager，為該應用程式分配第一個Container，要求它在這個Container中啟動應用程式的ApplicationMaster，與YARN-Cluster區別的是在該ApplicationMaster不執行SparkContext，只與SparkContext進行聯絡進行資源的分派
Client中的SparkContext初始化完畢後，與ApplicationMaster建立通訊，向ResourceManager註冊，根據任務資訊向ResourceManager申請資源（Container）
一旦ApplicationMaster申請到資源（也就是Container）後，便與對應的NodeManager通訊，要求它在獲得的Container中啟動CoarseGrainedExecutorBackend，CoarseGrainedExecutorBackend啟動後會向Client中的SparkContext註冊並申請Task
client中的SparkContext分配Task給CoarseGrainedExecutorBackend執行，CoarseGrainedExecutorBackend執行Task並向Driver 彙報執行的狀態和進度，以讓Client隨時掌握各個任務的執行狀態，從而可以在任務失敗時重新啟動任務
應用程式執行完成後，Client的SparkContext向ResourceManager申請登出並關閉自己

YARN-Cluster模式

在YARN-Cluster模式中，當使用者向YARN中提交一個應用程式後，YARN將分兩個階段執行該應用程式：
1. 第一個階段是把Spark的Driver作為一個ApplicationMaster在YARN叢集中先啟動；
2. 第二個階段是由ApplicationMaster建立應用程式，然後為它向ResourceManager申請資源，並啟動Executor來執行Task，同時監控它的整個執行過程，直到執行完成
YARN-cluster的工作流程分為以下幾個步驟

Spark Yarn Client向YARN中提交應用程式，包括ApplicationMaster程式、啟動ApplicationMaster的命令、需要在Executor中執行的程式等
ResourceManager收到請求後，在叢集中選擇一個NodeManager，為該應用程式分配第一個Container，要求它在這個Container中啟動應用程式的ApplicationMaster，其中ApplicationMaster進行SparkContext等(Driver)的初始化
ApplicationMaster向ResourceManager註冊，這樣使用者可以直接通過ResourceManage檢視應用程式的執行狀態，然後它將採用輪詢的方式通過RPC協議為各個任務申請資源，並監控它們的執行狀態直到執行結束
一旦ApplicationMaster申請到資源（也就是Container）後，便與對應的NodeManager通訊，要求它在獲得的Container中啟動CoarseGrainedExecutorBackend，CoarseGrainedExecutorBackend啟動後會向ApplicationMaster中的SparkContext註冊並申請Task。這一點和Standalone模式一樣，只不過SparkContext在Spark Application中初始化時，使用CoarseGrainedSchedulerBackend配合YarnClusterScheduler進行任務的排程，其中YarnClusterScheduler只是對TaskSchedulerImpl的一個簡單包裝，增加了對Executor的等待邏輯等
ApplicationMaster中的SparkContext分配Task給CoarseGrainedExecutorBackend執行，CoarseGrainedExecutorBackend執行Task並向ApplicationMaster彙報執行的狀態和進度，以讓ApplicationMaster隨時掌握各個任務的執行狀態，從而可以在任務失敗時重新啟動任務
應用程式執行完成後，ApplicationMaster向ResourceManager申請登出並關閉自己

Spark Client 和 Spark Cluster的區別:

理解YARN-Client和YARN-Cluster深層次的區別之前先清楚一個概念：Application Master。在YARN中，每個Application例項都有一個ApplicationMaster程式，它是Application啟動的第一個容器。它負責和ResourceManager打交道並請求資源，獲取資源之後告訴NodeManager為其啟動Container。從深層次的含義講YARN-Cluster和YARN-Client模式的區別其實就是ApplicationMaster程式的區別
YARN-Cluster模式下，Driver執行在AM(Application Master)中，它負責向YARN申請資源，並監督作業的執行狀況。當使用者提交了作業之後，就可以關掉Client，作業會繼續在YARN上執行，因而YARN-Cluster模式不適合執行互動型別的作業
YARN-Client模式下，Driver執行在Client客戶端中，Application Master僅僅向YARN請求Executor，Client會和請求的Container通訊來排程他們工作，也就是說Client不能離開

Spark的執行流程

Spark的基本執行流程

spark執行流程圖如下：

構建Spark Application的執行環境，啟動SparkContext
SparkContext向資源管理器（可以是Standalone，Mesos，Yarn）申請執行Executor資源，並啟動StandaloneExecutorbackend
Executor向SparkContext申請Task
SparkContext將應用程式分發給Executor
SparkContext構建成DAG圖，將DAG圖分解成Stage、將Taskset傳送給Task Scheduler，最後由Task Scheduler將Task傳送給Executor執行
Task在Executor上執行，執行完釋放所有資源

RDD的基本執行流程

RDD在Spark中執行大概分為以下三步：
1. 建立RDD物件
2. DAGScheduler模組介入運算，計算RDD之間的依賴關係，RDD之間的依賴關係就形成了DAG
3. 每一個Job被分為多個Stage。劃分Stage的一個主要依據是當前計算因子的輸入是否是確定的（寬依賴窄依賴），如果是則將其分在同一個Stage，避免多個Stage之間的訊息傳遞開銷
示例圖如下：

以下面一個按 A-Z 首字母分類，查詢相同首字母下不同姓名總個數的例子來看一下 RDD 是如何執行起來的

建立 RDD 上面的例子除去最後一個 collect 是個動作，不會建立 RDD 之外，前面四個轉換都會建立出新的 RDD 。因此第一步就是建立好所有 RDD( 內部的五項資訊 )？建立執行計劃 Spark 會盡可能地管道化，並基於是否要重新組織資料來劃分階段 (stage) ，例如本例中的 groupBy() 轉換就會將整個執行計劃劃分成兩階段執行。最終會產生一個 DAG(directed acyclic graph ，有向無環圖 ) 作為邏輯執行計劃

排程任務將各階段劃分成不同的任務 (task) ，每個任務都是資料和計算的合體。在進行下一階段前，當前階段的所有任務都要執行完成。因為下一階段的第一個轉換一定是重新組織資料的，所以必須等當前階段所有結果資料都計算出來了才能繼續

spark學習筆記--叢集執行Spark
2018-07-12
Spark筆記
【java學習】控制執行流程
2018-09-29
Java
Seata的AT模式的執行流程
2024-10-13
模式
《深入理解Spark》之Spark的整體執行流程
2018-08-15
Spark
SQL 解析與執行流程
2024-01-08
SQL
Java多執行緒學習（3）執行緒同步與執行緒通訊
2018-10-15
Java執行緒
Spark Task 的執行流程② - 建立、分發 Task
2021-09-09
Spark
【Spark】 Spark作業執行原理--獲取執行結果
2019-01-08
Spark
多執行緒學習一（多執行緒基礎）
2019-04-09
執行緒
多執行緒學習一
2021-10-19
執行緒
Java多執行緒學習（1）建立執行緒與執行緒的生命週期
2018-10-10
Java執行緒
Spark的執行原理
2019-03-04
Spark
spark執行原理、模型
2018-08-03
Spark模型
Java多執行緒學習（八）執行緒池與Executor 框架
2019-03-01
Java執行緒框架
Mybatis執行流程學習之手寫mybatis雛形
2021-01-22
MyBatis
Golang原始碼學習：排程邏輯（三）工作執行緒的執行流程與排程迴圈
2020-05-27
Golang原始碼執行緒
MyBatis執行流程
2024-05-12
MyBatis
HA執行流程
2020-10-24
MapReduce執行流程
2021-11-09
Mysql 執行流程
2022-04-21
MySql
SpringMVC執行流程
2021-04-04
SpringMVC
Java多執行緒學習（一）Java多執行緒入門
2018-03-21
Java執行緒
Spark Task 的執行流程④ - task 結果的處理
2021-09-09
Spark
自適應查詢執行：在執行時提升Spark SQL執行效能
2020-12-21
SparkSQL
spark-stage任務劃分、sparkclient執行模式
2020-10-22
Sparkclient模式
Spark原理-物理執行圖
2020-12-10
Spark
Java多執行緒學習——執行緒通訊
2019-01-19
Java執行緒
Java多執行緒學習（2）執行緒控制
2018-10-14
Java執行緒
#大學#Java多執行緒學習02（執行緒同步）
2019-01-07
Java執行緒
java 執行緒學習
2023-05-07
Java執行緒
執行緒池學習
2019-03-19
執行緒
深入理解執行緒池的執行流程
2024-09-08
執行緒
spark 原始碼分析之二十一 -- Task的執行流程
2019-07-29
Spark原始碼
spark-submit提交任務時執行流程（簡單版）
2024-07-12
SparkMIT
Mybatis原始碼系列執行流程（一）
2021-12-31
MyBatis原始碼
多執行緒學習(二)CountDownLunch與CyclicBarrier
2018-04-14
執行緒
「MySQL」 MySQL執行流程
2019-02-21
MySql
javaWeb的執行流程
2018-06-10
JavaWeb