DATAX
DataX
DataX 是阿里巴巴集團內被廣泛使用的離線資料同步工具/平臺,實現包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各種異構資料來源之間高效的資料同步功能。
下載安裝datax.tar,下載連結
MysqlWriter 外掛實現了寫入資料到 Mysql 主庫的目的表的功能。在底層實現上, MysqlWriter 透過 JDBC 連線遠端 Mysql 資料庫,並執行相應的 insert into ... 或者 ( replace into ...) 的 sql 語句將資料寫入 Mysql,內部會分批次提交入庫,需要資料庫本身採用 innodb 引擎。
MysqlWriter 面向ETL開發工程師,他們使用 MysqlWriter 從數倉匯入資料到 Mysql。同時 MysqlWriter 亦可以作為資料遷移工具為DBA等使用者提供服務。
[root@scripts]# tar -xvf datax.tar
[root@datax]# ls
bin conf job lib log log_perf plugin script tmp
[root@job]# ls
job.json
[root@job]# vi mysql2mysql.json
[root@job]# cat mysql2mysql.json
{
"job": {
"setting": {
"speed": {
"channel": 8
},
"errorLimit": {
"record": 0,
"percentage": 0.02
}
},
"content": [
{
"reader": {
"name": "mysqlreader",
"parameter": {
"username": "username",
"password": "password",
"column": [
"order_id",
"parent_order_id",
"chartered_id",
"multi_order_id",
"carpool_order_id",
"order_no",
"city_id",
"type",
"order_service_type",
"booking_user_id",
"booking_phone",
"rider_phone",
"booking_start_time",
"booking_start_addr",
"booking_end_addr",
"booking_start_short_addr",
"booking_end_short_addr",
"driver_id",
"license_plates",
"order_status",
"channels_num",
"is_display",
"dissent_flag",
"is_carpool",
"create_date",
"update_date",
"sub_order_count",
"sub_order_flag",
"push_driver_type",
"buyout_flag",
"is_order_others",
"auto_level_up",
"finished_date",
"order_create_date",
"order_update_date",
"cancel_type",
"business_id",
"order_type",
"fact_date",
"fact_start_addr",
"fact_end_addr",
"cancelorder_penalty"
],
"connection": [
{
"table": [
"yoon_table" #表名
],
"jdbcUrl": [
"jdbc:mysql://192.168.11.111:3306/yoon" #連線地址、埠、資料庫
]
}
],
"where": "order_create_date >='2019-05-01 00:00:00' and order_create_date < '2019-06-01 00:00:00'" #根據where條件傳輸資料,全表導的話就把where條件去掉即可
}
},
"writer": {
"name": "mysqlwriter",
"parameter": {
"writeMode": "replace",
"username": "username",
"password": "password",
"column": [
"order_id",
"parent_order_id",
"chartered_id",
"multi_order_id",
"carpool_order_id",
"order_no",
"city_id",
"type",
"order_service_type",
"booking_user_id",
"booking_phone",
"rider_phone",
"booking_start_time",
"booking_start_addr",
"booking_end_addr",
"booking_start_short_addr",
"booking_end_short_addr",
"driver_id",
"license_plates",
"order_status",
"channels_num",
"is_display",
"dissent_flag",
"is_carpool",
"create_date",
"update_date",
"sub_order_count",
"sub_order_flag",
"push_driver_type",
"buyout_flag",
"is_order_others",
"auto_level_up",
"finished_date",
"order_create_date",
"order_update_date",
"cancel_type",
"business_id",
"order_type",
"fact_date",
"fact_start_addr",
"fact_end_addr",
"cancelorder_penalty"
],
"connection": [
{
"jdbcUrl": "jdbc:mysql://192.168.11.222:3306/hank?useUnicode=true&characterEncoding=utf8", #連線地址、埠、資料庫
"table": [
"yoon_hank" #表名
]
}
]
}
}
}
]
}
}
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28939273/viewspace-2663448/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- DataX系列
- DataX -- 配置解析
- datax開啟hana支援以及dolphinscheduler開啟datax任務
- ETLforOracletoPostgreSQL3-DATAXOracleSQL
- 基於DataX的資料同步(上)-DataX介紹以及安裝
- 資料同步Datax與Datax_web的部署以及使用說明Web
- DataX - [02] 安裝部署
- DataX的知識碎片
- 阿里DataX極簡教程阿里
- 使用dataX遇到的坑
- 基於DataX的資料同步(下)-應用DataX進行資料同步
- 大資料技術 - DataX大資料
- DataX 3.0 原始碼解析一原始碼
- DataX簡介(3.0版本)
- 資料同步工具Sqoop和DataXOOP
- 用DataX導資料到Clickhouse遇到的坑
- datax postgresqlwriter 支援覆蓋寫入 writemode=updateSQL
- Datax離線資料抽取(MySQL--MySQL)MySql
- Datax離線資料抽取(Oracle--MySQL)OracleMySql
- Datax離線資料抽取(MySQL--Oracle)MySqlOracle
- 【ETL工具】DataX + DataXWeb 初使用過程記錄Web
- Datax助力輕鬆遷移SQLServer資料至GreatSQLSQLServer
- 2.6倍!WhaleTunnel 客戶POC實景對弈DataX
- TDengine可通過資料同步工具 DataX讀寫
- ETL資料整合工具DataX、Kettle、ETLCloud特點對比Cloud
- 異源資料同步 → 如何獲取 DataX 已同步資料量?
- 阿里的又一款資料高效同步工具DataX,真香!阿里
- 使用DataX同步MaxCompute資料到TableStore(原OTS)最佳化指南
- Alibaba 資料庫遷移開源工具 Datax 安裝和使用資料庫開源工具
- DataX將MySql資料庫資料同步到Oracle資料庫MySql資料庫Oracle
- 通過Web ETL統一排程和管理DataX任務Web
- 異源資料同步 → DataX 同步啟動後如何手動終止?
- 比Sqoop功能更加強大開源資料同步工具DataX實戰OOP
- 異構資料來源同步之資料同步 → DataX 使用細節
- DataX將Oracle資料庫資料同步到達夢資料庫Oracle資料庫
- 異構資料來源同步之資料同步 → datax 改造,有點意思
- 使用RestCloud ETL Shell元件實現定時排程DataX離線任務RESTCloud元件
- DataX二次開發詳解-Kingbasees86Reader、Kingbasees86Writer外掛