通過DTS將RDS的資料實時同步至DataHub
準備工作
- 建立一個資料庫和表,您可以選擇使用阿里雲的RDS資料庫,也可以在本地伺服器上自建資料庫。本案例以華東1區的RDS MySQL資料庫為例,資料庫表的名稱為datav_test,欄位及資料如下圖所示。
- 登入阿里雲Datahub控制檯,選擇華東1,單擊建立Project,建立一個Datahub專案(本案例的專案名稱為dts_test)。
資料同步
- 進入阿里雲DTS控制檯,單擊左側選單欄中的資料同步。
- 單擊建立同步作業,購買資料傳輸服務例項,配置如下圖所示。
注意:
- **源例項**選擇**MySQL**,**目標例項**選擇**Datahub**。 - 源例項區域和目標例項區域以及同步作業例項區域需保持一致。
- 購買成功後,返回控制檯,單擊例項右側的配置同步鏈路。
- 選擇同步通道的源及目標例項,如下圖所示,完成後單擊授權白名單並進入下一步。
- 選擇同步物件。選擇需要同步的表,單擊 > 圖示按鈕。
- 單擊預檢查並啟動,啟動預檢查。如果預檢查成功,系統會顯示如下對話方塊。
- 單擊關閉,返回資料同步頁面,單擊頁面右上角的重新整理,檢視例項狀態。此時正常情況下,例項狀態應該顯示為初始化中。
說明:初始化的時間依賴於同步表的數量大小。
- 當初始化完成後,同步鏈路即進入同步中的狀態,此時源跟目標例項的同步鏈路才真正建立完成。單擊頁面右上角的重新整理,檢視例項的同步概況。
- 進入阿里雲Datahub控制檯,單擊專案右側的檢視,進入Topic頁面,可以看到已經同步完成的表的名稱即為topic的名稱。
- 單擊topic右側的檢視,選擇Schema,檢視已經同步完成的表的結構。
資料採集
說明:由於Datahub同步的是增量資料,因此您必須在資料庫中增加一條或多條資料,才能同步到Datahub中。此案例採用手動插入資料的方式,僅作為參考,在實際應用中,您表中的資料應該是實時寫入的。
- 登入您的資料庫,在表中插入一條資料,如下圖所示。
- 回到阿里雲Datahub控制檯,單擊topic右側的檢視,選擇Shards。
- 單擊某個shard右側的資料抽樣。
- 在Shard資料抽樣頁面,指定一個時間(該時間要小於等於最新資料時間,否則無法抽取資料),單擊抽樣,檢視資料同步結果。
常見問題
- DTS 資料同步失敗,如何處理?
可能原因:同步鏈路規格配置不合適導致。
解決方法:參考資料同步規格說明,選擇合適的規格,重新建立同步作業。
- Datahub 中單擊資料抽樣,抽樣資料為空,如何處理?
可能原因:
- 指定的時間大於最新資料時間。
- 資料庫中不存在增量資料。
解決方法:
-
在進行資料抽樣時,設定指定的時間小於等於最新資料時間,再次單擊抽樣,檢視資料是否為空。
- 是,執行下一步。
- 否,問題解決。
-
在您的資料庫中插入一條或多條資料,重新回到Datahub控制檯,對資料進行抽樣。
如果問題仍然無法解決,請在控制檯上提交工單,或者直接聯絡阿里雲技術支援工程師。
(本文作者為阿里雲大資料產品文件工程師)
相關文章
- ETL資料整合丨透過ETLCloud工具,將Oracle資料實時同步至Doris中CloudOracle
- 基於OGG Datahub外掛將Oracle資料同步上雲Oracle
- 透過 Canal 將 MySQL 資料實時同步到 EasysearchMySql
- Restcloud ETl資料通過時間戳實現增量資料同步RESTCloud時間戳
- 一種小資源情況下RDS資料實時同步StarRocks方案
- DTS-077100 向目標庫同步資料時出錯
- 阿里 Canal 實時同步 MySQL 增量資料至 ClickHouse 資料庫阿里MySql資料庫
- Kafka Connect如何實現同步RDS binlog資料?Kafka
- mysql通過kafka實現資料實時同步(三)——es叢集配置MySqlKafka
- 通過 POI 將資料庫中的資料上傳至 OSS 物件儲存資料庫物件
- ETL資料整合丨將GreenPlum資料同步至Doris數倉
- 如果通過流資料實現實時分析?
- PG 資料庫 從阿里雲pg rds 同步資料。資料庫阿里
- 如何將豆瓣觀影記錄實時同步至部落格中
- mysql資料同步至redisMySqlRedis
- 什麼是資料實時同步,為什麼資料實時同步很重要
- Mysql資料實時同步實踐MySql
- rsync+inotify資料的實時同步
- 大資料匯流排(DataHub)大資料
- 【SQL】Oracle資料庫通過job定期重建同步表資料SQLOracle資料庫
- TDengine可通過資料同步工具 DataX讀寫
- 通過Vue的過濾器實現資料的資料脫敏Vue過濾器
- 資料同步:教你如何實時把資料從 MySQL 同步到 OceanBaseMySql
- 阿里雲:一張圖看懂DTS資料同步最新價格調整阿里
- kettle 實時同步資料(插入/更新/刪除資料)
- 認識資料實時同步神器—Canal
- MySQL 到Oracle 實時資料同步HYXSMySqlOracle
- oracle 資料透過goldengate 實時同步到kafka訊息佇列中OracleGoKafka佇列
- 高效資料傳輸:Java透過繫結快速將資料匯出至ExcelJavaExcel
- oracle 觸發器,當一個表更新或插入時將資料同步至另個庫中的某個表中Oracle觸發器
- 高效實現旺店通與金蝶雲的資料同步方案
- Dcat admin 後臺 資料實時非同步重新整理,有人做過嗎?非同步
- Vue父子元件通過prop非同步傳輸資料踩坑Vue元件非同步
- mysql和redis實時同步資料怎麼實現MySqlRedis
- 通過python操控MYSQL新增資料,並將資料新增到EXCEL中PythonMySqlExcel
- 如何將本地資料同步到 shopify 或 shopify 資料同步到本地
- 在Linux中,rsync 同步資料時,如何過濾出所有.txt的檔案不同步?Linux
- 將 EMQX Cloud 資料通過公網橋接到 AWS IoTMQCloud橋接