SeaTunnel用於海量資料的同步和轉換
SeaTunnel 是一個分散式、高效能的資料整合平臺,用於海量資料(離線和實時)的同步和轉換。
SeaTunnel 原名 Waterdrop,2021 年 10 月 12 日起更名為 SeaTunnel。
SeaTunnel是一個非常好用的超高效能分散式資料整合平臺,支援海量資料的實時同步。每天可以穩定高效地同步數百億資料,已應用於近百家企業的生產中。
SeaTunnel會盡力解決海量資料同步中可能遇到的問題:
- 資料丟失和重複
- 任務累積和延遲
- 低吞吐量
- 長週期應用於生產環境
- 缺乏應用執行狀態監控
SeaTunnel 使用場景
- 海量資料同步
- 海量資料整合
- 具有海量資料的 ETL
- 海量資料聚合
- 多源資料處理
特點
- 簡單易用,配置靈活,低程式碼開發
- 實時流式傳輸
- 離線多源資料分析
- 高效能、海量資料處理能力
- 模組化和外掛機制,易於擴充套件
- 支援SQL資料處理和聚合
- 支援 Spark 結構化流
- 支援 Spark 2.x
資料處理管道由多個過濾器構成,以滿足各種資料處理需求。如果習慣SQL,也可以直接透過SQL構建資料處理管道,簡單高效。目前,SeaTunnel 支援的過濾器列表還在擴充套件中。此外,您可以開發自己的資料處理外掛,因為整個系統易於擴充套件。
SeaTunnel 支援的外掛
- 輸入外掛 Fake、File、Hdfs、Kafka、Druid、S3、Socket、自研輸入外掛
- 過濾器外掛 Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid, 自研過濾器外掛
- 輸出外掛 Elasticsearch、File、Hdfs、Jdbc、Kafka、Druid、Mysql、S3、Stdout、自研輸出外掛
相關文章
- SeaTunnel如何建立Socket資料同步作業?
- Apache SeaTunnel 2.3.7釋出:全新支援大型語言模型資料轉換Apache模型
- 用於日期轉換的訊息轉換器
- 基於DataX的資料同步(下)-應用DataX進行資料同步
- 簡化資料流:Apache SeaTunnel實現多表同步的高效指南Apache
- Mongodb資料同步和主從切換MongoDB
- 使用SeaTunnel從InfluxDB同步資料到DorisUX
- Java資料型別的顯式轉換和隱式轉換Java資料型別
- String和基本資料型別的相互轉換資料型別
- scala和java資料型別轉換Java資料型別
- 使用MapStruct和Lombok轉換資料物件StructLombok物件
- Stimulsoft Reports如何建立新的資料轉換、編輯資料轉換
- VTS:基於Apache SeaTunnel的開源向量資料遷移工具Apache
- python--進位制轉換和資料交換Python
- 適用於Mac的WinX HD影片轉換器:影片轉換教程Mac
- C++資料結構和pb資料結構的轉換C++資料結構
- JSON筆記,用於資料交換JSON筆記
- 快手關於海量模型資料處理的實踐模型
- 海量資料和高併發的解決方案
- SAP CRM產品主資料應用裡value node和model node的轉換
- 資料庫轉換工具,不同資料庫之前任意轉換資料庫
- 使用Apache SeaTunnel高效整合和管理SftpFile資料來源ApacheFTP
- flask非同步資料交換celery的使用Flask非同步
- ABAP和XML資料格式互相轉換的兩種方式XML
- JS 中一定要了解的資料型別和資料轉換JS資料型別
- JS資料型別的轉換JS資料型別
- JSONObject應用Json字串和Object物件之間的轉換,Map封裝資料思路JSONObject字串物件封裝
- Python JSON 使用指南:解析和轉換資料PythonJSON
- ncbi下載資料sra和轉換fastq流程AST
- Apache SeaTunnel資料處理引擎適配的演進和規劃Apache
- 漫談OB | OceanBase 在海量資料和高併發下的應用實踐
- 資料同步和資料備份
- Hive資料格式轉換Hive
- 資料型別轉換資料型別
- 資料類新轉換
- 資料集轉換JSONJSON
- CGO實戰專案中常用的資料轉換和使用Go
- 基於TableStore的海量電商訂單後設資料管理