SeaTunnel用於海量資料的同步和轉換
SeaTunnel 是一個分散式、高效能的資料整合平臺,用於海量資料(離線和實時)的同步和轉換。
SeaTunnel 原名 Waterdrop,2021 年 10 月 12 日起更名為 SeaTunnel。
SeaTunnel是一個非常好用的超高效能分散式資料整合平臺,支援海量資料的實時同步。每天可以穩定高效地同步數百億資料,已應用於近百家企業的生產中。
SeaTunnel會盡力解決海量資料同步中可能遇到的問題:
- 資料丟失和重複
- 任務累積和延遲
- 低吞吐量
- 長週期應用於生產環境
- 缺乏應用執行狀態監控
SeaTunnel 使用場景
- 海量資料同步
- 海量資料整合
- 具有海量資料的 ETL
- 海量資料聚合
- 多源資料處理
特點
- 簡單易用,配置靈活,低程式碼開發
- 實時流式傳輸
- 離線多源資料分析
- 高效能、海量資料處理能力
- 模組化和外掛機制,易於擴充套件
- 支援SQL資料處理和聚合
- 支援 Spark 結構化流
- 支援 Spark 2.x
資料處理管道由多個過濾器構成,以滿足各種資料處理需求。如果習慣SQL,也可以直接透過SQL構建資料處理管道,簡單高效。目前,SeaTunnel 支援的過濾器列表還在擴充套件中。此外,您可以開發自己的資料處理外掛,因為整個系統易於擴充套件。
SeaTunnel 支援的外掛
- 輸入外掛 Fake、File、Hdfs、Kafka、Druid、S3、Socket、自研輸入外掛
- 過濾器外掛 Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid, 自研過濾器外掛
- 輸出外掛 Elasticsearch、File、Hdfs、Jdbc、Kafka、Druid、Mysql、S3、Stdout、自研輸出外掛
相關文章
- SeaTunnel如何建立Socket資料同步作業?
- 海量資料轉換遷移的程式碼自動生成
- Apache SeaTunnel 2.3.7釋出:全新支援大型語言模型資料轉換Apache模型
- 簡化資料流:Apache SeaTunnel實現多表同步的高效指南Apache
- 關於海量資料常用的資料結構資料結構
- 基於DataX的資料同步(下)-應用DataX進行資料同步
- 海量資料處理 (轉)
- Mongodb資料同步和主從切換MongoDB
- 使用SeaTunnel從InfluxDB同步資料到DorisUX
- 用於日期轉換的訊息轉換器
- 關於海量資料的獲取問題
- Java資料型別的顯式轉換和隱式轉換Java資料型別
- 將Standby資料庫臨時轉換為主資料庫用於測試資料庫
- 網路資料庫的複製和同步(轉)資料庫
- 轉換RDBA的檔案和資料塊地址(轉)
- 【轉載】大資料workshop:《雲資料·大計算:海量日誌資料分析與應用》大資料
- 使用Apache SeaTunnel高效整合和管理SftpFile資料來源ApacheFTP
- 用XML/XSLT將行資料轉換為列資料 (轉)XML
- 快手關於海量模型資料處理的實踐模型
- JavaScript和json對資料格式的轉換JavaScriptJSON
- scala和java資料型別轉換Java資料型別
- 海量資料和高併發的解決方案
- C++資料結構和pb資料結構的轉換C++資料結構
- Apache SeaTunnel資料處理引擎適配的演進和規劃Apache
- 適用於Mac的WinX HD影片轉換器:影片轉換教程Mac
- Oracle資料庫的SCN轉換成時間和時間轉換成SCNOracle資料庫
- 基於TableStore的海量電商訂單後設資料管理
- 關於海量資料處理分析的經驗總結
- String和基本資料型別的相互轉換資料型別
- SQL資料型別和C#資料型別間的轉換SQL資料型別C#
- Stimulsoft Reports如何建立新的資料轉換、編輯資料轉換
- 資料型別的轉換資料型別
- flashback query和logmnr用於恢復資料的誤刪除(轉)
- 醫學影象資料格式和格式轉換
- 使用MapStruct和Lombok轉換資料物件StructLombok物件
- 資料同步和資料備份
- SAP CRM產品主資料應用裡value node和model node的轉換
- 大資料與海量資料的區別大資料