Spark3.0YarnCluster模式任務提交流程原始碼分析

馬晟發表於2020-09-06

原文網址 : https://www.cnblogs.com/jordan95225/p/13623996.html

SparkYarn模式原始碼

1.通過spark-submit指令碼提交spark程式

在spark-submit指令碼里面執行了SparkSubmit類的main方法

2.執行SparkSubmit類的main方法

3.呼叫doSubmit方法

4.呼叫submit方法

在submit方法裡呼叫doRunMain方法，最終呼叫runMain方法

5.在runMain方法裡面獲取mainClass，再去執行start方法

在這裡根據提交模式來選擇mainClass

6.在start方法裡面去呼叫YarnClusterApplication的start方法

7.YarnClusterApplication方法裡面new一個yarnClient物件，並執行run方法

8.run方法裡執行submitApplication提交application

9.submitApplication方法裡首先會去請求RM並返回一個appId，然後建立container和application上下文環境並執行submitApplication提交application

這裡通過createContainerLaunchContext方法啟動了ApplicationMaster

10.呼叫ApplicationMaster類的main方法

在這裡首先new一個ApplicationMaster，然後呼叫了master的run方法

11.呼叫ApplicationMaster的run方法

這裡會根據是否是叢集模式執行不同的方法

12.呼叫runDriver方法

12.1呼叫startUserApplication方法啟動一個driver執行緒

12.2將AM註冊到RM

12.3分配資源

這裡通過呼叫runAllocatedContainers方法在分配的container裡面執行executors

12.4呼叫ExecutorRunnable的run方法，然後呼叫run方法裡面的startContainer方法來啟動executor

12.5呼叫prepareCommand方法來執行org.apache.spark.executor.YarnCoarseGrainedExecutorBackend類

13.執行YarnCoarseGrainedExecutorBackend類main方法的run方法建立executor終端

14.呼叫setupEndpoint建立executor終端

15.反向註冊executor到driver

16.driver端接收

在SparkContext中有SchedulerBackend，它是一個特質，具體實現類為CoarseGrainedSchedulerBackend，該類中有一個receiveAndReply方法來對executor的註冊做回覆

相關文章

Flink原始碼剖析：Jar包任務提交流程
2021-01-19
原始碼JAR
MapReduce——客戶端提交任務原始碼分析
2021-06-09
客戶端原始碼
spark原始碼之任務提交過程
2018-10-15
Spark原始碼
spark核心(下)——job任務提交原始碼解析
2020-12-16
Spark原始碼
[原始碼解析]Oozie來龍去脈之提交任務
2020-06-29
原始碼
springboot 事務建立流程原始碼分析
2021-09-18
Spring Boot原始碼
LiteOS-任務篇-原始碼分析-任務排程函式
2020-10-13
原始碼函式
flink1.10版local模式提交job流程分析
2020-11-19
模式
LiteOS核心原始碼分析：任務LOS_Schedule
2021-09-11
原始碼
spring事務管理原始碼分析（二）事務處理流程分析
2018-12-02
Spring原始碼
Mapreduce Job提交流程原始碼和切片原始碼詳解
2020-10-13
原始碼
PostgreSQL 原始碼解讀（122）- MVCC#7(提交事務-整體流程)
2019-01-18
SQL原始碼MVCC#
spark-submit提交任務時執行流程（簡單版）
2024-07-12
SparkMIT
比特幣原始碼分析:任務排程器的使用
2019-02-22
比特幣原始碼
執行流程原始碼分析
2024-09-27
原始碼
WindowManager呼叫流程原始碼分析
2018-03-30
原始碼
Dubbo原始碼分析（六）服務引用的具體流程
2019-03-25
原始碼
Spring原始碼分析（八）深入瞭解事務管理的流程
2019-03-03
Spring原始碼
spark 原始碼分析之十九 -- Stage的提交
2019-07-26
Spark原始碼
Seata 分散式事務框架 TCC 模式原始碼分析
2019-05-02
分散式框架模式原始碼
原始碼分析Retrofit請求流程
2018-11-04
原始碼
axios原始碼分析——請求流程
2018-06-16
iOS原始碼
Tomcat原始碼分析--啟動流程
2020-10-19
Tomcat原始碼
Flutter啟動流程原始碼分析
2020-04-01
Flutter原始碼
View繪製流程原始碼分析
2019-04-19
View原始碼
Activity啟動流程原始碼分析
2018-03-29
原始碼
apiserver原始碼分析——啟動流程
2021-10-04
APIServer原始碼
SpringMVC請求流程原始碼分析
2022-05-29
SpringMVC原始碼
Mybatis執行流程原始碼分析
2020-12-15
MyBatis原始碼
Dubbo原始碼分析（四）服務暴露的具體流程（上）
2019-03-20
原始碼
Dubbo原始碼分析（五）服務暴露的具體流程（下）
2019-03-20
原始碼
Nacos（二）原始碼分析Nacos服務端註冊示例流程
2021-01-18
原始碼服務端
LiteOS-任務篇-原始碼分析-系統啟動函式
2020-10-09
原始碼函式
Sentinel-Go 原始碼系列（二）｜初始化流程和責任鏈設計模式
2021-11-09
Go原始碼設計模式
懸賞任務系統原始碼_任務接單平臺原始碼PHP版附app
2022-01-09
原始碼PHPAPP
RxJava2原始碼分析（一）：基本流程分析
2019-01-06
RxJava原始碼
SpringCloud元件 & 原始碼剖析：Eureka服務註冊方式流程全面分析
2019-03-04
SpringGCCloud元件原始碼
Android Activity啟動流程原始碼分析
2019-02-28
Android原始碼