Spark的四種部署方式概括

Mark_ZQ發表於2020-11-28

1.Local模式

Local模式就是執行在一臺計算機上的模式,通常用於在本機上測試,當不設定master引數的值時,預設此模式,具體有以下幾種設定master的方式。

  1. local:所有計算都執行在一個執行緒當中,沒有任何平行計算。
  2. local[n]:指定使用n個執行緒來執行計算。
  3. local[*]:按照CPU的最多核數來設定執行緒數。

2.Standalone模式

設定master引數的值為spark://host:port,即開啟Standalone模式,將構建一個基於Master/Slave的資源排程叢集,Spark任務提交給Master執行。

3.Yarn模式

Spark客戶端直接連線Yarn,不需要格外構建Spark叢集,有yarn-client和yarn-cluster兩種模式,主要區別在於Driver程式的執行節點不同(yarn-client的Driver程式執行在客戶端,適用於互動、除錯,而yarn-cluster的Driver程式執行在由ResourceManager啟動的ApplicationMaster中,適用於生產環境)。master引數設定為yarn,deploy-mode引數為client或者cluster。

4.Mesos模式

Spark客戶端直接連線Mesos,不需要額外構建Spark叢集。

在Spark的後續版本中,已經支援連線到Kubernetes叢集。

這四種模式的差別在於資源管理者是誰。

相關文章