【Spark篇】---Spark中資源和任務排程原始碼分析與資源配置引數應用

LHBlog發表於2018-02-05

原文網址 : https://www.cnblogs.com/LHWorldBlog/p/8419472.html

一、前述

Spark中資源排程是一個非常核心的模組，尤其對於我們提交引數來說，需要具體到某些配置，所以提交配置的引數於原始碼一一對應，掌握此節對於Spark在任務執行過程中的資源分配會更上一層樓。由於原始碼部分太多本節只抽取關鍵部分和結論闡述，更多的偏於應用。

二、具體細節

1、Spark-Submit提交引數

Options:

--master

MASTER_URL, 可以是spark://host:port, mesos://host:port, yarn, yarn-cluster,yarn-client, local

--deploy-mode

DEPLOY_MODE, Driver程式執行的地方，client或者cluster,預設是client。

--class

CLASS_NAME, 主類名稱，含包名

--jars

逗號分隔的本地JARS, Driver和executor依賴的第三方jar包（Driver是把運算元中的邏輯傳送到executor中去執行，所以如果邏輯需要依賴第三方jar包比如oreacl的包時這裡用--jars新增）

--files

用逗號隔開的檔案列表,會放置在每個executor工作目錄中

--conf

spark的配置屬性

--driver-memory

Driver程式使用記憶體大小（例如：1000M，5G），預設1024M

--executor-memory

每個executor記憶體大小（如：1000M，2G），預設1G

Spark standalone with cluster deploy mode only:

--driver-cores

Driver程式的使用core個數（預設為1），僅限於Spark standalone模式

Spark standalone or Mesos with cluster deploy mode only:

--supervise

失敗後是否重啟Driver，僅限於Spark alone或者Mesos模式

Spark standalone and Mesos only:

--total-executor-cores

executor使用的總核數，僅限於SparkStandalone、Spark on Mesos模式

Spark standalone and YARN only:

--executor-cores

每個executor使用的core數，Spark on Yarn預設為1，standalone預設為worker上所有可用的core。

YARN-only:

--driver-cores

driver使用的core,僅在cluster模式下，預設為1。

--queue

QUEUE_NAME 指定資源佇列的名稱,預設：default

--num-executors

一共啟動的executor數量，預設是2個。

2、資源排程原始碼分析

資源請求簡單圖

資源排程Master路徑：

路徑：spark-1.6.0/core/src/main/scala/org.apache.spark/deploy/Master/Master.scala

提交應用程式，submit的路徑：

路徑:spark-1.6.0/core/src/main/scala/org.apache.spark/ deploy/SparkSubmit.scala

總結：

Executor在叢集中分散啟動，有利於task計算的資料本地化。
預設情況下（提交任務的時候沒有設定--executor-cores選項），每一個Worker為當前的Application啟動一個Executor,這個Executor會使用這個Worker的所有的cores和1G記憶體。
如果想在Worker上啟動多個Executor，提交Application的時候要加--executor-cores這個選項。
預設情況下沒有設定--total-executor-cores,一個Application會使用Spark叢集中所有的cores。設定多少個用多少。

結論演示

叢集中總資源如下：

使用Spark-submit提交任務演示。也可以使用spark-shell

2.1、預設情況每個worker為當前的Application啟動一個Executor，這個Executor使用叢集中所有的cores和1G記憶體。

./spark-submit --master spark://node01:7077 --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 10000

2.2、在workr上啟動多個Executor,設定--executor-cores引數指定每個executor使用的core數量。

./spark-submit --master spark://node01:7077 --executor-cores 1 --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 10

2.3、記憶體不足的情況下啟動core的情況。Spark啟動是不僅看core配置引數，也要看配置的core的記憶體是否夠用。

./spark-submit --master spark://node01:7077 --executor-cores 1 --executor-memory 3g --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 10000

可見並沒有啟動起來，因為記憶體不夠。。。

./spark-submit --master spark://node01:7077 --executor-cores 1 --executor-memory 2g --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 10000

2.4、--total-executor-cores叢集中共使用多少cores

注意：一個程式不能讓叢集多個節點共同啟動。

./spark-submit --master spark://node01:7077 --executor-cores 1 --executor-memory 2g --total-executor-cores 3 --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 10000

./spark-submit --master spark://node01:7077 --executor-cores 1 --executor-memory 1g --total-executor-cores 3 --class org.apache.spark.examples.SparkPi ../lib/spark-examples-1.6.0-hadoop2.6.0.jar 200

注意：生產環境中一定要加上資源的配置因為Spark是粗粒度排程資源框架，不指定的話，預設會消耗所有的cores！！！！

3 、任務排程原始碼分析

Action運算元開始分析

任務排程可以從一個Action類運算元開始。因為Action類運算元會觸發一個job的執行。

劃分stage,以taskSet形式提交任務

DAGScheduler 類中getMessingParentStages()方法是切割job劃分stage。可以結合以下這張圖來分析：

Spark中資源排程和任務排程
2021-11-12
Spark
Spark - [03] 資源排程模式
2024-10-11
Spark模式
spark原始碼之任務提交過程
2018-10-15
Spark原始碼
開源專案推薦 - 巨鯨任務排程平臺（Spark、Flink）
2020-07-26
Spark
LiteOS-任務篇-原始碼分析-任務排程函式
2020-10-13
原始碼函式
5、基礎篇-資源排程
2021-08-29
Spark3.0YarnCluster模式任務提交流程原始碼分析
2020-09-06
SparkYarn模式原始碼
spark核心(下)——job任務提交原始碼解析
2020-12-16
Spark原始碼
Spark 原始碼分析系列
2019-07-28
Spark原始碼
比特幣原始碼分析:任務排程器的使用
2019-02-22
比特幣原始碼
Yarn資源排程
2020-09-23
Yarn
Spark的相關引數配置
2024-03-15
Spark
Spark 效能調優--資源調優
2021-09-09
Spark
開源公開課丨大資料排程系統 Taier 任務排程介紹
2022-08-22
大資料AI
Spark RPC框架原始碼分析（三）Spark心跳機制分析
2019-01-17
SparkRPC框架原始碼
Spring Boot應用中進行任務排程
2019-04-04
Spring Boot
OkHttpClient原始碼分析（一）—— 同步、非同步請求分析和Dispatcher的任務排程
2018-07-25
HTTPclient原始碼非同步
Spark SQL外部資料來源與實現機制
2019-08-14
SparkSQL
Spring Boot 原始碼分析資料來源 + Mybatis 配置
2018-06-18
Spring Boot原始碼MyBatis
Spark core篇 Rpc原始碼1
2021-09-09
SparkRPC原始碼
spark streaming執行kafka資料來源
2020-11-14
SparkKafka
Spark如何進行動態資源分配
2020-10-19
Spark
spark接入mysql，檢視源端資料
2024-08-07
SparkMySql
大資料分享Spark任務和叢集啟動流程
2020-06-04
大資料Spark
檢視Spark任務的詳細資訊
2022-10-31
Spark
Spark叢集和任務執行
2020-11-06
Spark
spark 原始碼分析之十八 -- Spark儲存體系剖析
2019-07-23
Spark原始碼
spark 原始碼分析之十五 -- Spark記憶體管理剖析
2019-07-17
Spark原始碼記憶體
基於Hive進行數倉建設的資源後設資料資訊統計：Spark篇
2021-04-08
HiveSpark
[原始碼分析] 定時任務排程框架 Quartz 之故障切換
2021-05-24
原始碼框架quartz
spark 原始碼分析之十六 -- Spark記憶體儲存剖析
2019-07-18
Spark原始碼記憶體
「Spark從精通到重新入門(二)」Spark中不可不知的動態資源分配
2021-12-15
Spark
【spark筆記】在idea用maven匯入spark原始碼
2021-09-09
Spark筆記IdeaMaven原始碼
揭開阿里巴巴複雜任務資源混合排程技術面紗
2020-12-24
阿里
【Spark篇】---Spark解決資料傾斜問題
2018-03-04
Spark
Spark應用程式開發引數調優深入剖析-Spark商業調優實戰
2019-03-04
Spark
spark 原始碼分析之十三 -- SerializerManager剖析
2019-07-15
Spark原始碼
ThreadX應用筆記：核心初始化和任務排程
2021-01-12
thread筆記
開源分散式任務排程系統就選：DolphinScheduler
2023-02-28
分散式

【Spark篇】---Spark中資源和任務排程原始碼分析與資源配置引數應用

相關文章