DM 原始碼閱讀系列文章（三）資料同步處理單元介紹

PingCAP發表於2019-04-11

原文網址 : https://juejin.im/post/5caeb6a8e51d456e2809fb5a

作者：lan

本文為 DM 原始碼閱讀系列文章的第三篇，上篇文章介紹了 DM 的整體架構，DM 元件 DM-master 和 DM-worker 的入口程式碼，以及兩者之間的資料互動模型。本篇文章詳細地介紹 DM 資料同步處理單元（DM-worker 內部用來同步資料的邏輯單元），包括資料同步處理單元實現了什麼功能，資料同步流程、執行邏輯，以及資料同步處理單元的 interface 設計。

資料同步處理單元

從上圖可以瞭解到目前 DM 包含 relay log、dump、load、binlog replication（sync） 4 個資料同步處理單元，涵蓋了以下資料同步處理的功能：

處理單元	功能
relay log	持久化 MySQL/MariaDB Binlog 到磁碟
dump	從 MySQL/MariaDB dump 全量資料
load	載入全量資料到 TiDB cluster
binlog replication（sync）	複製 relay log 儲存的 Binlog 到 TiDB cluster

資料同步流程

Task 資料同步流程初始化操作步驟：

DM-master 接收到 task，將 task 拆分成 subtask 後分發給對應的各個 DM-worker；
DM-worker 接收到 subtask 後建立一個 subtask 物件，然後初始化資料同步流程。

從初始化資料同步流程的程式碼中我們可以看到，根據 task 配置項 task-mode 的不同，DM-worker 會初始化不同的資料同步流程：

task-mode	同步流程	需要的資料同步處理單元
all	全量同步 -> 增量資料同步	relay log、dump、load、binlog replication（sync）
full	全量同步	dump、load
incremental	增量同步	relay log，binlog replication（sync）

執行邏輯

DM 資料同步處理單元 interface 定義在 dm/unit，relay log、dump、load、binlog replication（sync）都實現了該 interface（golang interface 介紹）。

實際上 DM-worker 中的資料同步處理單元分為兩類：

全域性共享單例。dm-worker 啟動的時候只初始化一次這類資料同步處理單元，所有的 subtask 都可以使用這類資料同步處理單元的服務；relay log 屬於這種型別。
subtask 獨享。dm-worker 會為每個 subtask 初始化一系列的資料同步處理單元；dump、load、binlog replication（sync）屬於這種型別。

兩類資料同步處理單元的使用邏輯不同，這篇文件會著重講一下 subtask 獨享的資料同步處理單元的使用邏輯，不會囊括更多的 relay log 相關的內容，後面會有單獨一篇文章詳細介紹它。

relay log 相關使用程式碼在 dm/worker/relay.go 、具體功能實現程式碼在 relay/relay.go，有興趣的同學也可以先行閱讀一下相關程式碼，relay log 的程式碼註釋也是比較豐富，並且簡單易懂。

subtask 獨享資料同步處理單元使用邏輯相關程式碼在 dm/worker/subtask.go。subtask 物件包含的主要屬性有：

units：初始化後要執行的資料同步處理單元。
currUnit：當前正在執行的資料同步處理單元。
prevUnit：上一個執行的資料同步處理單元。
stage：subtask 的執行階段狀態，包含 New、Running、Paused，Stopped，Finished，具體定義的程式碼在 dm/proto/dmworker.proto。
result：subtask 當前資料同步處理單元的執行結果，對應著 stage = Paused/Stopped/Finished 的詳細資訊。

主要的邏輯有：

初始化 subtask 物件例項的時候會編排資料同步處理單元的執行先後順序。所有的資料同步處理單元都實現了 dm/unit interface，所以接下來的執行中就不需要關心具體的資料同步處理單元的型別，可以按照統一的 interface 方法來執行資料同步處理單元，以及對其進行狀態監控。
初始化各個資料同步處理單元。subtask 在執行前集中地初始化所有的資料同步處理單元，我們計劃之後優化成在各個資料同步處理單元執行前再進行初始化，這樣子減少資源的提前或者無效的佔用。
資料同步處理單元執行狀態監控。通過監控當前執行的資料同步處理單元的結果，將 subtask 的 stage 設定為 Paused/Stopped/Finished。
- 如果當前的資料同步處理單元工作已經完成，則會根據 units 來選取下一個需要執行的資料同步處理單元，如果沒有需要的資料同步處理單元，那麼會將 subtask 的 stage 設定為 Finished。這裡有個注意點，因為 binlog replication 單元永遠不會結束，所以不會進入 Finished 的狀態。
- 如果返回的 result 裡面包含有錯誤資訊，則會將 subtask 的 stage 設定為 Paused，並且列印具體的錯誤資訊。
- 如果是使用者手動暫停或者停止，則會將 subtask 的 stage 設定為 Paused/Stopped。這裡有個注意點，這個時候 stage=Paused 是沒有錯誤資訊的。
資料同步處理單元之間的執行交接處理邏輯。部分資料同步處理單元在開始工作的時候需要滿足一些前置條件，例如 binlog replication（sync）的執行需要等待 relay log 處理單元已經儲存下來其開始同步需要的 binlog 檔案，否則 subtask 將處於 stage=Paused 的暫停等待狀態。

小結

本篇文章主要介紹了資料同步處理單元實現了什麼功能，資料同步流程、執行邏輯，以及資料同步處理單元的 interface 設計。後續會分三篇文章詳細地介紹資料同步處理單元的實現，包括：

dump/load 全量同步實現
binlog replication 增量同步實現
relay log 實現

DM 原始碼閱讀系列文章（二）整體架構介紹
2019-03-26
原始碼架構
DM 原始碼閱讀系列文章（一）序
2019-03-20
原始碼
DM 原始碼閱讀系列文章（四）dump/load 全量同步的實現
2019-04-28
原始碼
TiDB 原始碼閱讀系列文章（二十三）Prepare/Execute 請求處理
2019-01-04
TiDB原始碼
openGauss資料庫原始碼解析系列文章——openGauss簡介（三）
2022-12-26
資料庫原始碼
TiDB 原始碼閱讀系列文章（二十）Table Partition
2018-10-29
TiDB原始碼
TiDB 原始碼閱讀系列文章（十）Chunk 和執行框架簡介
2018-06-19
TiDB原始碼框架
TiDB 原始碼閱讀系列文章（十四）統計資訊（下）
2018-07-19
TiDB原始碼
TiDB 原始碼閱讀系列文章（十二）統計資訊（上）
2018-07-06
TiDB原始碼
TiDB 原始碼閱讀系列文章（十九）tikv-client（下）
2018-10-08
TiDB原始碼client
【原始碼閱讀】Glide原始碼閱讀之into方法（三）
2019-04-18
原始碼IDE
TiKV 原始碼解析系列文章（十三）MVCC 資料讀取
2021-09-09
原始碼MVC
TiDB 原始碼閱讀系列文章（十六）INSERT 語句詳解
2019-02-27
TiDB原始碼
TiCDC 原始碼閱讀（二）TiKV CDC 模組介紹
2023-01-04
原始碼
openGauss資料庫原始碼解析系列文章--openGauss簡介（一）
2022-11-11
資料庫原始碼
openGauss資料庫原始碼解析系列文章——openGauss簡介（二）
2022-12-02
資料庫原始碼
TiDB 原始碼閱讀系列文章（五）TiDB SQL Parser 的實現
2019-03-03
TiDB原始碼SQL
Magic原始碼閱讀（三）——資料匯入和構建
2020-10-09
原始碼
Scrapy原始碼閱讀分析_4_請求處理流程
2019-02-19
原始碼
【原始碼閱讀】AndPermission原始碼閱讀
2019-05-09
原始碼
Scrapy原始碼閱讀分析_1_整體框架和流程介紹
2019-02-19
原始碼框架
gin 原始碼閱讀(5) - 靈活的返回值處理
2021-10-20
原始碼
【詳解】ThreadPoolExecutor原始碼閱讀（三）
2018-11-02
thread原始碼
MT6177晶片資料/處理器介紹
2018-10-08
晶片
MT6771晶片資料/處理器介紹
2018-09-20
晶片
海量資料處理利器 Roaring BitMap 原理介紹
2024-06-20
電商系統最小單元——系列介紹
2020-06-15
TiKV 原始碼解析系列文章（三）Prometheus（上）
2019-03-11
原始碼Prometheus
tidb之dm叢集同步異常處理
2022-03-01
TiDB
原始碼閱讀：SDWebImage（三）——NSData+ImageContentType
2018-05-29
原始碼Web
Qt原始碼閱讀(三) 物件樹管理
2023-03-29
QT原始碼物件
【原始碼閱讀】Glide原始碼閱讀之with方法（一）
2019-04-17
原始碼IDE
TiDB 原始碼閱讀系列文章（二十一）基於規則的優化 II
2018-12-12
TiDB原始碼優化
httprunner3原始碼解讀（1）簡單介紹原始碼模組內容
2021-11-04
HTTP原始碼
MT7603E/MT7603U處理器,MTK晶片系列資料介紹
2018-10-10
晶片
SingletonKit單例原始碼閱讀學習
2024-06-17
單例原始碼
Laravel 原始碼閱讀指南 -- 使用者認證系統 (基礎介紹)
2018-06-22
Laravel原始碼
直播平臺原始碼，資訊的雙端同步處理
2022-05-06
原始碼

DM 原始碼閱讀系列文章（三）資料同步處理單元介紹

資料同步處理單元

資料同步流程

執行邏輯

小結

相關文章