海豚排程任務型別Apache SeaTunnel部署指南

海豚调度發表於2024-04-02

file

Apache DolphinScheduler已支援Apache SeaTunnel任務型別，本文介紹了SeaTunnel任務型別如何建立，任務引數，以及任務樣例。

一、Apache SeaTunnel

SeaTunnel 任務型別，用於建立並執行 SeaTunnel 型別任務。worker 執行該任務的時候，會透過 start-seatunnel-spark.sh 、 start-seatunnel-flink.sh 和 seatunnel.sh 命令解析 config 檔案。

二、建立任務

點選專案管理 -> 專案名稱 -> 工作流定義，點選“建立工作流”按鈕，進入 DAG 編輯頁面；
拖動工具欄的任務節點到畫板中。

三、任務引數

啟動指令碼：選擇你想要執行任務的啟動指令碼，包括 seatunnel.sh, start-seatunnel-flink-13-connector-v2.sh, start-seatunnel-flink-15-connector-v2.sh, start-seatunnel-flink-connector-v2.sh, start-seatunnel-flink.sh, start-seatunnel-spark-2-connector-v2.sh, start-seatunnel-spark-3-connector-v2.sh, start-seatunnel-spark-connector-v2.sh, start-seatunnel-spark.sh
FLINK
執行模型：支援 run 和 run-application 兩種模式
選項引數：用於新增 Flink 引擎本身引數，例如 -m yarn-cluster -ynm seatunnel
SPARK
部署方式：指定部署模式，cluster client
Master：指定 Master 模型，yarn local spark mesos，其中 spark 和 mesos 需要指定 Master 服務地址，例如：127.0.0.1:7077
SEATUNNEL_ENGINE
部署方式：指定部署模式，cluster local
自定義配置：支援自定義配置或從資源中心選擇配置檔案
指令碼：在任務節點那自定義配置資訊，包括四部分：env source transform sink

四、任務樣例

該樣例演示為使用 Flink 引擎從 Fake 源讀取資料列印到控制檯。

1.在 DolphinScheduler 中配置 SeaTunnel 環境
若生產環境中要是使用到 SeaTunnel 任務型別，則需要先配置好所需的環境，配置檔案如下：/dolphinscheduler/conf/env/dolphinscheduler_env.sh。

file
2.配置 SeaTunnel 任務節點
根據上述引數說明，配置所需的內容即可。

file

Config 樣例

env {
  execution.parallelism = 1
}

source {
  FakeSource {
    result_table_name = "fake"
    field_name = "name,age"
  }
}

transform {
  sql {
    sql = "select name,age from fake"
  }
}

sink {
  ConsoleSink {}
}

————————————————

版權宣告：本文為博主原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處連結和本宣告。

原文連結：https://blog.csdn.net/zhengzaifeidelushang/article/details/136685864

本文由白鯨開源提供釋出支援！

Spring 指南（排程任務）
2019-01-19
Spring
Apache SeaTunnel 及 Web 功能部署指南(小白版)
2024-03-01
ApacheWeb
用海豚排程器定時排程從Kafka到HDFS的kettle任務指令碼
2024-04-17
Kafka指令碼
LTS分散式任務排程部署
2019-03-09
分散式
海豚排程調優 | 如何解決任務被禁用出現的Bug
2024-06-27
任務排程
2018-11-24
告別手動排程，海豚排程器 3.1.x 叢集部署讓你輕鬆管理多機！
2024-04-23
Apache SeaTunnel Committer 進階指南
2024-09-13
ApacheMIT
Airflow 任務排程
2024-04-24
AI
Laravel 任務排程
2019-11-26
Laravel
Apache SeaTunnel k8s 叢集模式 Zeta 引擎部署指南
2024-04-30
ApacheK8S模式
分散式任務排程
2019-03-04
分散式
Spark中資源排程和任務排程
2021-11-12
Spark
Timer和TimerTask 任務排程
2018-07-09
聊聊PowerJob的任務排程
2024-02-15
Linux 定時任務排程
2021-08-17
Linux
分散式排程任務-ElasticJob
2021-06-08
分散式AST
LeetCode 621 任務排程器
2020-12-05
LeetCode
Apache DolphinScheduler大規模任務排程系統對大資料實時Flink任務支援
2024-09-02
Apache大資料
laravel框架任務排程（定時執行任務）
2019-05-11
Laravel框架
海豚排程調優 | 正在執行的工作流(DAG)如何重新拉起失敗的任務(Task)
2024-06-21
Python任務排程模組APScheduler
2019-02-16
Python
LiteOS-任務篇-原始碼分析-任務排程函式
2020-10-13
原始碼函式
Spring排程定時任務的方式
2019-01-13
Spring
Android 中的定時任務排程
2019-03-04
Android
力扣-621. 任務排程器
2024-06-22
力扣
任務排程的思考和總結
2018-03-31
Flink - Task 任務排程執行流程
2023-03-25
力扣 621. 任務排程器
2020-12-05
力扣
任務排程框架Quartz快速入門！
2020-12-26
框架quartz
621. 任務排程器（構造）
2020-12-05
Apache DolphinScheduler 限制秒級別的定時排程
2024-12-10
Apache
【運維技巧】海豚排程工作流例項卡在正在停止&任務例項卡在正在執行怎麼辦？
2024-06-13
運維
Linux 中 Laravel 任務排程不執行
2020-06-09
LinuxLaravel
真香！SpringBoot官方支援任務排程框架了！
2020-11-01
Spring Boot框架
Aloha：一個分散式任務排程框架
2019-03-23
分散式框架
中介軟體---分散式任務排程---Celery
2019-02-17
分散式
任務排程的並行演算法
2018-04-03
並行演算法

海豚排程任務型別Apache SeaTunnel部署指南

一、Apache SeaTunnel

二、建立任務

三、任務引數

四、任務樣例

相關文章