Spark Standalone模式高可用部署

DB樂之者發表於2020-11-12

原文網址 : https://www.cnblogs.com/wenBlog/p/13965698.html

Spark模式

本文使用Spark的版本為：spark-2.4.0-bin-hadoop2.7.tgz。

spark的叢集採用3臺機器進行搭建，機器分別是server01，server02,server03。

其中：server01,server02設定為Master，server01,server02,server03為Worker。

1.Spark

下載地址：

http://spark.apache.org/downloads.html

選擇對應的版本進行下載就好，我這裡下載的版本是：spark-2.4.0-bin-hadoop2.7.tgz。

2.上傳及解壓

2.1 下載到本地後，上傳到Linux的虛擬機器上

scp spark-2.4.0-bin-hadoop2.7.tgz hadoop@server01:/hadoop

2.2 解壓

tar -zxvf spark-2.4.0-bin-hadoop2.7.tgz

2.3 重新命名

mv spark-2.4.0-bin-hadoop2.7 spark

3.配置環境

進入spark/conf目錄

3.1 複製配置檔案

cp slaves.template slaves

cp spark-env.sh.template spark-env.sh

3.2 修改slaves配置檔案

spark叢集的worker conf配置 slaves

server01

server02

server03

3.3 修改spark-env.sh配置檔案

# java環境變數

export JAVA_HOME=/usr/local/java

#spark home

export SPARK_HOME=/export/opt/spark/spark2.4.0

# spark叢集master程式主機host

export SPARK_MASTER_HOST=server01

# 配置zk 此處可以獨立配置zk list,逗號分隔

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=xxx.xxx.xxx.xxx:2181, xxx.xxx.xxx.xxx:2181……"

如下圖

3.4 下發到server02和server03機器上

scp -r /hadoop/spark hadoop@server02:/hadoop

scp -r /hadoop/spark hadoop@server03:/hadoop

3.5 修改server02機器上的spark-env.sh的SPARK_MASTER_HOST引數資訊

# 增加備用master主機,改為server02,將自己設定為master（備用）

export SPARK_MASTER_HOST=server02

3.6 配置環境變數

給server01,server02,server03機器上配置spark的環境變數

export SPARK_HOME=/export/opt/spark/spark2.4.0

export PATH=$PATH:${SPARK_HOME}/bin:${SPARK_HOME}/sbin

#使配置環境生效

source /etc/profile

4. 啟動Spark叢集

在server01機器上，進入spark目錄

4.1 分別啟動master和slaves程式

# 啟動master程式

sbin/start-master.sh

# 啟動3個worker程式，也可以每個機器獨立啟動需要輸入兩個master地址

sbin/start-slaves.sh

jps檢視程式1有既有master又有Worker,2,3只有Worker

4.2 直接使用start-all.sh啟動

sbin/start-all.sh

4.3 手動啟動server02機器上的master程式

進入spark目錄

sbin/start-master.sh

我們可以使用stop-all.sh殺死spark的程式

sbin/stop-all.sh

web頁面展示

在瀏覽器中輸入

server01:8080

Status：ALIVE 說明master為主Master

server02:8080

總結

　　部署完成後可以嘗試kill掉1的master，然後需要等幾分鐘後會重啟備用master，此時備用切換為主。

　　另外如果application被殺掉或者jvm出現問題，還可以通過增加引數 --supervise（需要安裝,pip install supervise）可以重新啟動application。

部署spark2.2叢集(standalone模式)
2022-08-08
Spark模式
Windows上搭建Standalone模式的Spark環境
2021-09-09
Windows模式Spark
深入理解Spark 2.1 Core （五）：Standalone模式
2021-09-09
Spark模式
spark 2.1.0 standalone模式配置&&打包jar包透過spark-submit提交
2018-10-08
Spark模式JARMIT
standalone執行模式下應用模式作業部署
2024-05-11
模式
nt高可用部署
2024-06-15
springcloud-高可用部署
2019-07-19
SpringGCCloud
高可用(keepalived)部署方案
2023-04-10
Spark叢集部署（standLone）模式
2019-01-24
Spark模式
keeplied + nginx +tomcat 高可用部署
2020-03-15
NginxTomcat
Keepalived高可用叢集部署
2023-01-27
Canal高可用架構部署
2021-03-25
架構
基於 ZooKeeper 搭建 Spark 高可用叢集
2019-06-29
Spark
Nginx + Keepalived 高可用叢集部署
2023-03-09
Nginx
部署Spark2.2叢集(on Yarn模式)
2022-08-16
SparkYarn模式
MySQL主主模式+Keepalived高可用
2020-10-28
MySql模式
LVS和keepalived高可用叢集部署
2020-11-05
kubeadm部署Kubernetes1.13.3高可用版本
2019-02-18
Zabbix 6.0：原生高可用(HA)方案部署
2022-02-23
高可用之戰：Redis Sentinal(哨兵模式）
2024-04-10
Redis模式
Redis哨兵模式高可用解決方案
2022-02-10
Redis模式
kubernetes 1.15.1 高可用部署 -- 從零開始
2019-07-28
Kafka高可用叢集部署與配置指南
2020-10-16
Kafka
Gitlab倉庫管理系統-高可用部署
2024-08-12
Gitlab
部署Kubernetes v1.22.10高可用叢集
2023-02-21
在Rainbond上部署高可用Apollo叢集
2022-04-11
AI
基於 Rainbond 部署 DolphinScheduler 高可用叢集
2022-07-14
AI
kubeadm部署高可用版Kubernetes1.21[更新]
2021-07-02
部署MHA+keepalived+ProxySQL高可用架構
2021-05-06
SQL架構
Redis+Keepalived高可用環境部署記錄
2018-05-07
Redis
附018.K3S-ETCD高可用部署
2020-05-14
ProxySQL Cluster 高可用叢集環境部署記錄
2019-02-21
SQL
LVS+Keepalived 高可用群集（理論+實戰部署）
2020-09-23
MySQL——MHA高可用群集部署及故障測試
2020-11-03
MySql
MySQL高可用群集MHA部署及故障測試分析
2020-11-05
MySql
Kubernetes實戰：高可用叢集的搭建和部署
2021-07-22
在Rainbond中一鍵部署高可用 EMQX 叢集
2022-05-10
AIMQ
MySQL 高可用架構 - MHA環境部署記錄
2020-12-10
MySql架構

Spark Standalone模式 高可用部署

相關文章

Spark Standalone模式高可用部署