Spark in action on Kubernetes - Spark Operator的原理解析

阿里云云棲社群發表於2019-04-03

原文網址 : https://juejin.im/post/5ca45d0951882544114cd9d6

前言

在上篇文章中，向大家介紹瞭如何使用Spark Operator在kubernetes叢集上面提交一個計算作業。今天我們會繼續使用上篇文章中搭建的Playground進行除錯與解析，幫助大家更深入的理解Spark Operator的工作原理。所以如果沒有瀏覽過上篇文章的同學，可以通過傳送門直達，先配置好Playground的環境。

Spark Operator的內部實現

在深入解析Spark Operator之前，我們先補充一些關於kubernetes operator的知識。2018年可以說是kubernetes operator氾濫的一年,各種operator如雨後春筍般出現。operator是擴充套件kubernetes以及與kubernetes整合的最佳方式之一。在kubernetes的設計理念中，有很重要的一條就是進行了抽象，比如對儲存進行抽象、對應用負載進行抽象、對接入層進行抽象等等。每個抽象又對應了各自生命週期管理的controller，開發者提交的Yaml實際上是對抽象終態的描述，而controller會監聽抽象的變化、解析並進行處理，最終嘗試將狀態修正到終態。

Spark in action on Kubernetes - Spark Operator的原理解析

那麼對於在kubernetes中未定義的抽象該如何處理呢，答案就是operator。一個標準operator通常包含如下幾個部分：1. CRD抽象的定義，負責描述抽象所能包含的功能。 2.CRD Controller ，負責解析CRD定義的內容以及生命週期的管理。3.clent-go的SDK，負責提供程式碼整合時使用的SDK。

有了這個知識儲備，那麼我們回過頭來看Spark Operator的程式碼，結構基本就比較明晰了。核心的程式碼邏輯都在pkg下，其中apis下面主要是定義了不同版本的API；client目錄下主要是自動生成的client-go的SDK；crd目錄下主要是定義的兩個自定義資源sparkapplication和scheduledsparkapplication的結構。controller目錄下主要定義的就是這個operator的生命週期管理的邏輯；config目錄下主要處理spark config的轉換。瞭解一個Operator能力最快捷的方式，就是檢視CRD的定義。在Spark Operator中定義了sparkapplication和scheduledsparkapplication兩個CRD，他們之間有什麼區別呢？

sparkapplication 是對常規spark任務的抽象，作業是單次執行的，作業執行完畢後，所有的Pod會進入Succeed或者Failed的狀態。而scheduledsparkapplication是對離線定時任務的一種抽象，開發者可以在scheduledsparkapplication中定義類似crontab的任務，實現spark離線任務的週期性定時排程。

上面這張圖是Spark中kubernetes的整合圖，也就是說當我們通過spark-submit提交作業的時候，會自動生成driver pod與exector pods。那麼引入了Spark Operator後，這個流程變成了什麼呢？

func (c *Controller) submitSparkApplication(app *v1beta1.SparkApplication) *v1beta1.SparkApplication {

    // prometheus的監控指標的暴露
    appToSubmit := app.DeepCopy()
    if appToSubmit.Spec.Monitoring != nil && appToSubmit.Spec.Monitoring.Prometheus != nil {
        if err := configPrometheusMonitoring(appToSubmit, c.kubeClient); err != nil {
            glog.Error(err)
        }
    }

  // 將CRD中的定義轉變為spark-submit的命令
    submissionCmdArgs, err := buildSubmissionCommandArgs(appToSubmit)
    if err != nil {
        app.Status = v1beta1.SparkApplicationStatus{
            AppState: v1beta1.ApplicationState{
                State:        v1beta1.FailedSubmissionState,
                ErrorMessage: err.Error(),
            },
            SubmissionAttempts:        app.Status.SubmissionAttempts + 1,
            LastSubmissionAttemptTime: metav1.Now(),
        }
        return app
    }

    // 在operator容器內通過spark-submit提交作業
    submitted, err := runSparkSubmit(newSubmission(submissionCmdArgs, appToSubmit))
    if err != nil {
        app.Status = v1beta1.SparkApplicationStatus{
            AppState: v1beta1.ApplicationState{
                State:        v1beta1.FailedSubmissionState,
                ErrorMessage: err.Error(),
            },
            SubmissionAttempts:        app.Status.SubmissionAttempts + 1,
            LastSubmissionAttemptTime: metav1.Now(),
        }
        c.recordSparkApplicationEvent(app)
        glog.Errorf("failed to run spark-submit for SparkApplication %s/%s: %v", app.Namespace, app.Name, err)
        return app
    }

    // 因為Pod的狀態也會被Spark Operator進行觀測，因此driver pod宕掉會被重新拉起
    // 這是和直接跑spark-submit的一大區別，提供了故障恢復的能力。
    if !submitted {
        // The application may not have been submitted even if err == nil, e.g., when some
        // state update caused an attempt to re-submit the application, in which case no
        // error gets returned from runSparkSubmit. If this is the case, we simply return.
        return app
    }

    glog.Infof("SparkApplication %s/%s has been submitted", app.Namespace, app.Name)
    app.Status = v1beta1.SparkApplicationStatus{
        AppState: v1beta1.ApplicationState{
            State: v1beta1.SubmittedState,
        },
        SubmissionAttempts:        app.Status.SubmissionAttempts + 1,
        ExecutionAttempts:         app.Status.ExecutionAttempts + 1,
        LastSubmissionAttemptTime: metav1.Now(),
    }
    c.recordSparkApplicationEvent(app)

    // 通過service暴露spark-ui
    service, err := createSparkUIService(app, c.kubeClient)
    if err != nil {
        glog.Errorf("failed to create UI service for SparkApplication %s/%s: %v", app.Namespace, app.Name, err)
    } else {
        app.Status.DriverInfo.WebUIServiceName = service.serviceName
        app.Status.DriverInfo.WebUIPort = service.nodePort
        // Create UI Ingress if ingress-format is set.
        if c.ingressURLFormat != "" {
            ingress, err := createSparkUIIngress(app, *service, c.ingressURLFormat, c.kubeClient)
            if err != nil {
                glog.Errorf("failed to create UI Ingress for SparkApplication %s/%s: %v", app.Namespace, app.Name, err)
            } else {
                app.Status.DriverInfo.WebUIIngressAddress = ingress.ingressURL
                app.Status.DriverInfo.WebUIIngressName = ingress.ingressName
            }
        }
    }
    return app
}
複製程式碼

其實到此，我們就已經基本瞭解Spark Operator做的事情了，首先定義了兩種不同的CRD物件，分別對應普通的計算任務與定時週期性的計算任務，然後解析CRD的配置檔案，拼裝成為spark-submit的命令，通過prometheus暴露監控資料採集介面，建立Service提供spark-ui的訪問。然後通過監聽Pod的狀態，不斷回寫更新CRD物件，實現了spark作業任務的生命週期管理。

Spark Operator的任務狀態機

當我們瞭解了Spark Operator的設計思路和基本流程後，還需要深入瞭解的就是sparkapplication的狀態都包含哪些，他們之間是如何進行轉換的，因為這是Spark Operator對於生命週期管理增強最重要的部分。

一個Spark的作業任務可以通過上述的狀態機轉換圖進行表示，一個正常的作業任務經歷如下幾個狀態：

New -> Submitted -> Running -> Succeeding -> Completed
複製程式碼

而當任務失敗的時候會進行重試，若重試超過最大重試次數則會失敗。也就是說如果在任務的執行過程中，由於資源、排程等因素造成Pod被驅逐或者移除，Spark Operator都會通過自身的狀態機狀態轉換進行重試。

Spark Operator的狀態排查

我們已經知道了Spark Operator最核心的功能就是將CRD的配置轉換為spark-submit的命令，那麼當一個作業執行不預期的時候，我們該如何判斷是哪一層出現的問題呢？首先我們要判斷的就是spark-submit時所生成的引數是否是預期的，因為CRD的Yaml配置雖然可以增強表達能力，但是提高了配置的難度與出錯的可能性。

func runSparkSubmit(submission *submission) (bool, error) {
    sparkHome, present := os.LookupEnv(sparkHomeEnvVar)
    if !present {
        glog.Error("SPARK_HOME is not specified")
    }
    var command = filepath.Join(sparkHome, "/bin/spark-submit")

    cmd := execCommand(command, submission.args...)
    glog.V(2).Infof("spark-submit arguments: %v", cmd.Args)
    if _, err := cmd.Output(); err != nil {
        var errorMsg string
        if exitErr, ok := err.(*exec.ExitError); ok {
            errorMsg = string(exitErr.Stderr)
        }
        // The driver pod of the application already exists.
        if strings.Contains(errorMsg, podAlreadyExistsErrorCode) {
            glog.Warningf("trying to resubmit an already submitted SparkApplication %s/%s", submission.namespace, submission.name)
            return false, nil
        }
        if errorMsg != "" {
            return false, fmt.Errorf("failed to run spark-submit for SparkApplication %s/%s: %s", submission.namespace, submission.name, errorMsg)
        }
        return false, fmt.Errorf("failed to run spark-submit for SparkApplication %s/%s: %v", submission.namespace, submission.name, err)
    }

    return true, nil
}
複製程式碼

預設情況下Spark Operator會通過glog level=2等級對外輸出每次作業提交後轉換的提交命令。而預設情況下，glog的level即為2，因此通過檢查Spark Operator的Pod日誌可以協助開發者快速排查問題。此外在sparkapplication上面也會通過event的方式進行狀態的記錄，上述狀態機之間的轉換都會通過event的方式體現在sparkapplication的物件上。掌握這兩種方式進行問題排查，可以節省大量排錯時間。

最後

使用Spark Operator是在kubernetes上實踐spark的最佳方式，和傳統的spark-submit相比提供了更多的故障恢復與可靠性保障，並且提供了監控、日誌、UI等能力的整合與支援。在下一篇中，會為大家介紹在kubernetes叢集中，提交spark作業時的如何使用外部儲存儲存的最佳實踐。

本文作者：莫源

原文連結

本文為雲棲社群原創內容，未經允許不得轉載。

Spark in action on Kubernetes - 儲存篇
2019-04-09
Spark
Spark in action on Kubernetes - 儲存篇（一）
2019-04-19
Spark
Spark的工作原理
2022-12-07
Spark
【Spark Java API】Action(3)—foreach、f
2021-09-09
SparkJavaAPI
【Spark Java API】Action(4)—sortBy、ta
2021-09-09
SparkJavaAPI
Spark的執行原理
2019-03-04
Spark
如何實現Spark on Kubernetes？
2020-10-09
Spark
Spark 以及 spark streaming 核心原理及實踐
2019-01-05
Spark
Spark Structured Streaming 解析 JSON
2018-09-14
SparkStructJSON
spark reduceByKey原始碼解析
2020-12-06
Spark原始碼
Spark Streaming ：基本工作原理
2018-10-12
Spark
spark執行原理、模型
2018-08-03
Spark模型
Spark RDD中Runtime流程解析
2020-09-04
Spark
Spark原理-物理執行圖
2020-12-10
Spark
【Spark】 Spark作業執行原理--獲取執行結果
2019-01-08
Spark
Spark之spark shell
2018-09-13
Spark
Spark Connector Reader 原理與實踐
2020-12-17
Spark
Kubernetes裡的Operator
2022-05-20
Spark on Yarn 和Spark on Mesos
2018-11-20
SparkYarn
Spark系列 - (3) Spark SQL
2023-02-23
SparkSQL
Spark 原始碼系列（九）Spark SQL 初體驗之解析過程詳解
2019-04-25
Spark原始碼SQL
Spark學習進度-Spark環境搭建&Spark shell
2021-01-04
Spark
Spark入門（四）--Spark的map、flatMap、mapToPair
2019-02-28
SparkAPTAI
Spark SQL:4.對Spark SQL的理解
2018-12-08
SparkSQL
Spark入門（五）--Spark的reduce和reduceByKey
2019-03-01
Spark
【Spark篇】---Spark中Shuffle檔案的定址
2018-03-07
Spark
【Spark】Spark容錯機制
2021-09-09
Spark
Spark 原始碼系列（六）Shuffle 的過程解析
2019-04-25
Spark原始碼
Spark原始碼解析-Yarn部署流程（ApplicationMaster）
2020-10-13
Spark原始碼YarnAPPAST
Spark SQL / Catalyst 內部原理與 RBO
2018-09-11
SparkSQL
Spark Streaming簡單入門（示例+原理）
2022-07-12
Spark
spark 的方式
2022-07-20
Spark
spark
2022-07-05
Spark
Spark記錄（二）：Spark程式的生命週期
2021-11-07
Spark
Spark RDD的預設分割槽數：（spark 2.1.0）
2021-09-09
Spark
Spark RDD在Spark中的地位和作用如何？
2021-05-12
Spark
spark學習筆記--Spark SQL
2018-07-13
Spark筆記SQL
spark學習筆記-- Spark Streaming
2018-08-03
Spark筆記

Spark in action on Kubernetes - Spark Operator的原理解析

前言

Spark Operator的內部實現

Spark Operator的任務狀態機

Spark Operator的狀態排查

最後

相關文章