番外2： go語言寫的簡要資料同步工具

Breeze0806發表於2024-07-21

原文網址 : https://www.cnblogs.com/onlyac/p/18314434

go-etl工具

作為go-etl工具的作者，想要安利一下這個小巧的資料同步工具，它在同步百萬級別的資料時表現極為優異，基本能在幾分鐘完成資料同步。

1.它能幹什麼的？

go-etl是一個資料同步工具集，目前支援MySQL,postgres,oracle,SQL SERVER,DB2等主流關係型資料庫以及csv，xlsx檔案之間的資料同步，在同步百萬級別的資料時表現極為優異，基本能在幾分鐘完成資料同步。

2.怎麼獲取它？

可以在最新發布版本下載到windows或者linux作業系統的64位版本二進位制程式

如圖所示第1個是不包含db2功能的linux二進位制程式，第2個是linux版本的，第3個是windows版本的

3.怎麼使用它？

go-etl datax二進位制程式是一款即插即用的程式，它的唯一難點是配置匯入配置檔案，配置它的配置檔案我們需要理解它的工作原理

3.1 工作原理

如上圖所示go-etl datax將資料從源資料來源同步到目的資料來源，

讀取器：reader為資料採集模組，負責採集資料來源的資料，將資料傳送給框架。
寫入器：writer為資料寫入模組，負責不斷向框架取資料，並將資料寫入到目的端。
框架：框架用於連線reader和writer，作為兩者的資料傳輸通道，並處理緩衝，流控，併發，資料轉換等核心技術問題

3.2 配置資料同步檔案

透過工作原理，需要配置reader和writer才能使go-etl datax準確地開始工作，本次以csv和mysql之間的資料同步為例, 以下是完整的配置檔案，但僅需要關注job.content即可

{
    "core" : {
        "container": {
            "job":{
                "id": 1,
                "sleepInterval":100
            }
        }
    },
    "job":{
        "content":[
            {
                "reader":{
                    "name": "csvreader",
                    "parameter": {
                        "path":["split.csv"],
                        "encoding":"utf-8"
                    }
                },
                "writer":{
                    "name": "mysqlwriter",
                    "parameter": {
                        "username": "root",
                        "password": "123456",
                        "writeMode": "insert",
                        "column": ["*"],
                        "connection":  {
                                "url": "tcp(192.168.15.130:3306)/mysql",
                                "table": {
                                    "db":"source",
                                    "name":"split"
                                }
                         },
                        "batchTimeout": "1s",
                        "batchSize":1000
                    }
                },
               "transformer":[]
            }
        ],
        "setting":{
            "speed":{
                "byte":0,
                "record":1024,
                "channel":4
            }
        }
    }
}

這裡先看reader，首先留意到的時reader的名字是csvreader，表明其源資料來源的型別，再例如如mysql的讀取器為mysqlreader，接著留意到的時reader的引數，path代表csv檔案的儲存位置，encoding為csv檔案的字符集。

這裡再看writer，首先留意到的時reader的名字是mysqlreader，表明其目的資料來源的型別，再例如csv的讀取器為mysqlreader，接著留意到的時writer的引數，需要配置的是username,password,connection的url和table,使用者名稱密碼無需多言，這裡要重點講講url，基本配置格式：tcp(ip:port)/db，ip:port代表mysql資料庫的IP地址和埠，db表示要預設連線的資料庫，table是需要寫入的表資訊。

3.3 執行程式匯入資料

將上述配置命名為config.json,將其和datax以及待匯入的資料檔案split.csv放到同一目錄下,在windows中使用命令列或者linux中使用終端執行以下命令

datax

3.4 批次寫入資料

3.4.1 源目的配置嚮導檔案

源目的配置嚮導檔案是csv檔案，每行配置可以配置如下:

path[table],path[table]

每一列可以是路徑或者是表名，注意所有的表要配置庫名或者模式名，需要在資料來源配置檔案配置。

3.4.2 批次生成資料配置集和執行指令碼

在windows中使用命令列或者linux中使用終端執行以下命令

datax -c tools/testData/xlsx.json -w tools/testData/wizard.csv

-c 指定資料來源配置檔案 -w 指定源目的配置嚮導檔案。

執行結果會在資料來源配置檔案目錄檔案生成源目的配置嚮導檔案行數的配置集，分別以指定資料來源配置檔案1.json,指定資料來源配置檔案2.json,...,指定資料來源配置檔案[n].json的配置集。

另外，在當前目錄會生成執行指令碼run.bat或者run.sh。

3.4.3 執行指令碼

windows中使用命令列即可

run.bat

linux中使用終端執行即可

run.sh

Go語言工具簡介 - Honeybadger
2020-12-25
Go
GO語言————2、GO語言環境安裝
2018-06-23
Go
Go語言簡史
2020-04-07
Go
go語言——資料型別
2024-08-12
Go資料型別
2-2 Go語言的包（package）
2020-10-02
GoPackage
go語言簡單入門--常識和資料型別
2021-09-09
Go資料型別
Go 語言讀寫 Excel 文件
2018-11-27
GoExcel
內外網資料的簡單單向同步
2019-06-28
GO語言一個簡單的工程
2020-10-28
Go
go語言資料型別轉換
2024-04-29
Go資料型別
go 學習筆記之10 分鐘簡要理解 go 語言閉包技術
2019-10-01
Go筆記
Go 1.21的2個語言變化
2023-02-18
Go
Go語言學習(2) - HelloWorld
2018-11-11
Go
Go 語言實戰: 編寫可維護 Go 語言程式碼建議
2020-02-18
Go
為什麼要學習Go語言呢？
2022-01-10
Go
go語言開發有哪些工具
2019-03-28
Go
Go語言交叉編譯工具gox
2021-09-09
Go編譯
Go語言學習(1) - 簡介
2018-11-11
Go
Go語言開發的PaaS工具有哪些？go學習
2019-11-28
Go
為什麼那麼多人要學習go語言?go語言有什麼特點?
2019-11-12
Go
6.Go語言基本資料型別
2024-03-23
Go資料型別
[譯] Go 語言實戰: 編寫可維護 Go 語言程式碼建議
2020-01-13
Go
[Go語言寫介面]一、使用xcgui完成go語言第一個軟體介面
2022-08-27
GoGUI
用Go語言寫HTTP中介軟體
2019-02-16
GoHTTP
Go 語言手寫本地 LRU 快取
2024-08-12
Go快取
【搞定Go語言】第2天4：Go語言基礎之流程控制
2020-10-24
Go
Go語言HTTP/2探險之旅
2018-10-15
GoHTTP
Go語言————1、初識GO語言
2018-06-23
Go
五款最棒的Go語言開發工具?
2020-10-22
Go
badamczewski/PowerUp：Rust/Go語言的反編譯工具
2021-11-25
RustGo編譯
Snow——簡單易用的 Go 語言業務框架
2019-07-09
Go框架
TDengine可通過資料同步工具 DataX讀寫
2022-06-24
go語言Json解析實用工具 - gjson
2019-04-22
GoJSON
Go語言面試題分享：選擇題11道（2）go語言開發
2019-11-27
Go面試題
Go語言學習(4) - 基本資料型別
2018-11-26
Go資料型別
go語言資料型別-基礎型別
2021-10-08
Go資料型別
GO語言學習——基本資料型別字串
2022-04-16
Go資料型別字串
優步公司的Go語言編寫風格指南
2019-10-12
Go