Apache DolphinScheduler-3.2.0叢集部署教程

海豚调度發表於2024-03-11

叢集部署方案(2 Master + 3 Worker)

  • Apache DolphinScheduler官網:https://dolphinscheduler.apache.org/zh-cn
  • Apache DolphinScheduler使用文件:https://dolphinscheduler.apache.org/zh-cn/docs/3.2.0
  • 截止2024-01-19,最新版本:3.2.0
  • 部署版本:apache-dolphinscheduler-3.2.0-bin.tar.gz
主機名 ip 部署服務
hadoop31 192.168.0.31 MasterServer、WorkerServer、ApiServer
hadoop32 192.168.0.32 MasterServer、WorkerServer
hadoop33 192.168.0.33 WorkerServer、AlertServer

前置準備工作

  • 作業系統:Linux CentOS 7.9 【CPU 4核+ 記憶體8G+】
  • JDK:下載JDK(1.8+),安裝並配置 JAVA_HOME 環境變數,並將其下的 bin 目錄追加到 PATH 環境變數中。
  • 資料庫:MySQL(5.7+)或者 PostgreSQL(8.2.15+),兩者任選其一即可,如 MySQL 則需要JDBC Driver 8.0.16 版本。【此處使用MySQL 8.2.0,驅動使用的是:mysql-connector-j-8.2.0.jar】
  • 註冊中心:Zookeeper(3.8.0+),叢集模式,【此處使用 3.8.3 版本】
  • 二進位制包:下載地址 https://www.apache.org/dyn/closer.lua/dolphinscheduler/3.2.0/apache-dolphinscheduler-3.2.0-bin.tar.gz
  • 注意:Apache DolphinScheduler 本身不依賴 Hadoop、Hive、Spark,但如果你執行的任務需要依賴他們,就需要有對應的環境支援。

埠說明

元件 預設埠 說明
MasterServer 5678 非通訊埠,只需本機埠不衝突即可
WorkerServer 1234 非通訊埠,只需本機埠不衝突即可
ApiApplicationServer 12345 提供後端通訊埠

叢集部署

時間同步

服務端:192.168.0.31 客戶端:192.168.0.32、192.168.0.33,服務端在31執行,客戶端在32、33執行

# 服務端和客戶端,安裝chrony
yum install chrony -y

# 服務端和客戶端,安裝chrony
yum install chrony -y

# 服務端(此處也可以使用 ntp.aliyun.com 來代替 192.168.0.31,使用阿里雲時間服務,如果使用31則是本機時間)
cat > /etc/chrony.conf << EOF 
pool 192.168.0.31 iburst
driftfile /var/lib/chrony/drift
makestep 1.0 3
rtcsync
allow 192.168.0.0/24
local stratum 10
keyfile /etc/chrony.keys
leapsectz right/UTC
logdir /var/log/chrony
EOF

# 客戶端
cat > /etc/chrony.conf << EOF 
pool 192.168.0.31 iburst
driftfile /var/lib/chrony/drift
makestep 1.0 3
rtcsync
keyfile /etc/chrony.keys
leapsectz right/UTC
logdir /var/log/chrony
EOF

# 客服端和服務端,重啟chrony,開機自啟動
systemctl restart chronyd
systemctl enable chronyd

#客戶端進行驗證
chronyc sources -v

# 引數解釋
#
# pool ntp.aliyun.com iburst
# 指定使用ntp.aliyun.com作為時間伺服器池,iburst選項表示在初始同步時會傳送多個請求以加快同步速度。
# 
# driftfile /var/lib/chrony/drift
# 指定用於儲存時鐘漂移資訊的檔案路徑。
# 
# makestep 1.0 3
# 設定當系統時間與伺服器時間偏差大於1秒時,會以1秒的步長進行調整。如果偏差超過3秒,則立即進行時間調整。
# 
# rtcsync
# 啟用硬體時鐘同步功能,可以提高時鐘的準確性。
# 
# allow 192.168.0.0/24
# 允許192.168.0.0/24網段範圍內的主機與chrony進行時間同步。
# 
# local stratum 10
# 將本地時鐘設為stratum 10,stratum值表示時鐘的準確度,值越小表示準確度越高。
# 
# keyfile /etc/chrony.keys
# 指定使用的金鑰檔案路徑,用於對時間同步進行身份驗證。
# 
# leapsectz right/UTC
# 指定時區為UTC。
# 
# logdir /var/log/chrony
# 指定日誌檔案存放目錄。

配置使用者、許可權

# 建立使用者需使用 root 登入
useradd dolphinscheduler

# 新增密碼
echo "dolphinscheduler" | passwd --stdin dolphinscheduler

# 配置 sudo 免密
sed -i '$adolphinscheduler  ALL=(ALL)  NOPASSWD: NOPASSWD: ALL' /etc/sudoers
sed -i 's/Defaults    requirett/#Defaults    requirett/g' /etc/sudoers

# 修改目錄許可權,使得部署使用者對二進位制包解壓後的 apache-dolphinscheduler-*-bin 目錄有操作許可權
chown -R dolphinscheduler:dolphinscheduler apache-dolphinscheduler-*-bin
chmod -R 755 apache-dolphinscheduler-*-bin

配置叢集免密登陸

# 使用建立的 dolphinscheduler 登陸,配置hadoop31到hadoop32、hadoop33免密登陸
su dolphinscheduler

# hadoop31節點,生成金鑰
ssh-keygen -t rsa

# hadoop31節點操作,配置向hadoop31、hadoop32、hadoop33節點免密
ssh-copy-id hadoop31
ssh-copy-id hadoop32
ssh-copy-id hadoop33

ZooKeeper叢集啟動

叢集安裝,參考教程:ZooKeeper叢集的安裝,本文安裝 ZK 版本為 3.8.3。參考教程中是 3.4.14,安裝步驟都是一樣兒的,對應著來就可以了。

# 啟動zk叢集
bin/zkServer.sh start

初始化資料庫

此處以 MySQL 為例

建立資料庫、使用者、授權

-- 進入MySQL命令列
[root@hadoop01]# mysql -u root -p 
Enter password: xxxxxx
-- 建立 dolphinscheduler 資料庫使用者和密碼,並限定登陸範圍
mysql > CREATE USER 'dolphinscheduler'@'%' IDENTIFIED BY 'dolphinscheduler';
-- 建立 dolphinscheduler 的後設資料,並指定編碼
mysql > CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
-- 為dolphinscheduler資料庫授權
mysql > grant all privileges on dolphinscheduler.* to 'dolphinscheduler'@'%';
-- 重新整理許可權
mysql > flush privileges;

解壓縮安裝包

# 將apache-dolphinscheduler-3.2.0-bin.tar.gz上傳至/opt/targz目錄下

# 解壓
[root@hadoop31 targz]# tar zxvf ./apache-dolphinscheduler-3.2.0-bin.tar.gz

# 修改目錄許可權,使得部署使用者對解壓縮後的檔案有操作許可權
[root@hadoop31 targz]# chown -R dolphinscheduler:dolphinscheduler apache-dolphinscheduler-3.2.0-bin

新增MySQL驅動至libs目錄

​ 此處使用 MySQL 8.2.0版本,對應使用 JDBC 驅動為 mysql-connector-j-8.2.0.jar,將該驅動移動至 DolphinScheduler 的每個模組下的 libs 目錄下。共5個目錄:

  • api-server/libs
  • alert-server/libs
  • master-server/libs
  • worker-server/libs
  • tools/libs

配置檔案修改

dolphinscheduler_env.sh 配置

# 修改dolphinscheduler_env.sh
vim apache-dolphinscheduler-3.2.0-bin/bin/env/dolphinscheduler_env.sh

# 在文末新增以下配置:
# JAVA_HOME, will use it to start DolphinScheduler server
# JDK配置
export JAVA_HOME=${JAVA_HOME:-/opt/soft/jdk8}

# Database related configuration, set database type, username and password
# MySQL資料庫配置
export DATABASE=${DATABASE:-mysql}
export SPRING_PROFILES_ACTIVE=${DATABASE}
export SPRING_DATASOURCE_URL="jdbc:mysql://192.168.17.28:3307/dolphinscheduler?useUnicode=true&characterEncoding=UTF-8&useSSL=false"
export SPRING_DATASOURCE_USERNAME=${SPRING_DATASOURCE_USERNAME:-"dolphinscheduler"}
export SPRING_DATASOURCE_PASSWORD=${SPRING_DATASOURCE_PASSWORD:-"dolphinscheduler"}

# DolphinScheduler server related configuration
export SPRING_CACHE_TYPE=${SPRING_CACHE_TYPE:-none}
export SPRING_JACKSON_TIME_ZONE=${SPRING_JACKSON_TIME_ZONE:-UTC}
export MASTER_FETCH_COMMAND_NUM=${MASTER_FETCH_COMMAND_NUM:-10}

# Registry center configuration, determines the type and link of the registry center
# zk註冊中心
export REGISTRY_TYPE=${REGISTRY_TYPE:-zookeeper}
export REGISTRY_ZOOKEEPER_CONNECT_STRING=${REGISTRY_ZOOKEEPER_CONNECT_STRING:-hadoop31:2181,hadoop32:2181,hadoop33:2181}

# Tasks related configurations, need to change the configuration if you use the related tasks.
# 其他環境配置(此處只配置了hadoop、hive,其他環境未部署)
# 如果你不使用某些任務型別,可以忽略不做配置,使用預設即可。比如Flink不使用,不做處理即可
export HADOOP_HOME=${HADOOP_HOME:-/opt/soft/hadoop-3.3.6}
export HADOOP_CONF_DIR=${HADOOP_CONF_DIR:-/opt/soft/hadoop-3.3.6/etc/hadoop}
export SPARK_HOME=${SPARK_HOME:-/opt/soft/spark}
export PYTHON_LAUNCHER=${PYTHON_LAUNCHER:-/opt/soft/python}
export HIVE_HOME=${HIVE_HOME:-/opt/soft/hive-3.1.3}
export FLINK_HOME=${FLINK_HOME:-/opt/soft/flink}
export DATAX_LAUNCHER=${DATAX_LAUNCHER:-/opt/soft/datax/bin/python3}

export PATH=$HADOOP_HOME/bin:$SPARK_HOME/bin:$PYTHON_LAUNCHER:$JAVA_HOME/bin:$HIVE_HOME/bin:$FLINK_HOME/bin:$DATAX_LAUNCHER:$PATH

install_env.sh檔案修改

# 修改install_env.sh
vim apache-dolphinscheduler-3.2.0-bin/bin/env/install_env.sh

# 按照叢集部署方案,內容如下:

# 叢集節點
ips=${ips:-"hadoop31,hadoop32,hadoop33"}

# ssh免密埠,使用預設
sshPort=${sshPort:-"22"}

# master節點
masters=${masters:-"hadoop31,hadoop32"}

# worker節點
workers=${workers:-"hadoop31:default,hadoop32:default,hadoop33:default"}

# alert節點
alertServer=${alertServer:-"hadoop33"}

# api節點
apiServers=${apiServers:-"hadoop31"}

# dolphinscheduler實際安裝路徑
installPath=${installPath:-"/opt/soft/dolphinscheduler-3.2.0"}

# 部署dolphinscheduler使用的使用者名稱
deployUser=${deployUser:-"dolphinscheduler"}

# zk根節點
zkRoot=${zkRoot:-"/dolphinscheduler"}

初始化後設資料

# 切換到apache-dolphinscheduler-3.2.0-bin目錄下,執行命令
[root@hadoop31 apache-dolphinscheduler-3.2.0-bin]# sh ./tools/bin/upgrade-schema.sh

# 此操作,會向MySQL資料庫寫入後設資料,共計65張表,如圖所示:

file

安裝Apache DolphinScheduler

# 執行install.sh部署命令
[root@hadoop31 apache-dolphinscheduler-3.2.0-bin]# ./bin/install.sh 

# 當看到下圖時,說明 DS 安裝完成

file

提示:

安裝完成後,此時安裝用到的 apache-dolphinscheduler-3.2.0-bin 檔案就沒用了。

此時,已經將 Apache DolphinScheduler 安裝到配置中指定的 /opt/soft/dolphinscheduler-3.2.0 目錄下了

登入Apache DolphinScheduler 控制檯

訪問地址:http://192.168.0.31:12345/dolphinscheduler/ui/

使用者名稱:admin

密碼:dolphinscheduler123

file

檢視監控中心Master/Worker節點資訊

1.Master節點

file

2.Worker節點

file

啟動/停止服務命令

第一次安裝後,會自動啟動所有服務。如有服務問題或者後續需要啟停,命令如下。以下指令碼都在 DolphinScheduler安裝目錄的bin下

# 一鍵停止叢集所有服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/stop-all.sh

# 一鍵啟動叢集所有服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/start-all.sh

# 啟/停 master 服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh start master-server 
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh stop master-server 

# 啟/停 worker 服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh start worker-server 
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh stop worker-server 

# 啟/停 api 服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh start api-server 
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh stop api-server 

# 啟/停 alert 服務
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh start alert-server 
sh /opt/soft/dolphinscheduler-3.2.0/bin/dolphinscheduler-daemon.sh stop alert-server 

本文結束,謝謝!

本文由 白鯨開源 提供釋出支援!

相關文章