GBASE助力山東移動大資料平臺PB級資料主倉業務跨機房無感知遷移

GBASE南大通用發表於2022-01-27

近日,山東移動完成了 PB 級資料倉儲跨機房的搬遷及擴容,專案實施做到了業務應用的程式碼零改動,通過修改 JDBC 的連線串,重啟服務就完成了系統割接,真正意義上做到了經分大資料資料主倉完全業務無感知的跨資料中心搬遷工作,目前擴容後系統已良好執行超過 30 天。

專案背景

2012 7 月開始山東移動經分系統開始採用 GBase 8a MPP 資料庫對 DB2 進行全面替換,經過幾期建設, 2020 年逐步建成大資料開放運營平臺,通過 MPP 資料庫服務能力為大資料平臺資料對內對外服務提供助力。

隨著承載量的劇增, 2021 年開始雲經分資料主倉的 72 節點叢集儲存超過 90% ,儲存長時間高水位可能引發頻繁的硬體故障,同時資料庫整體效能也會有所下降,這就要求運維團隊隨時監控叢集情況,一方面是運維投入的增加,一方面是影響新的業務開發,所以叢集擴容成為亟待解決的問題。

山東移動第五資料中心是省公司最早建設的資料中心之一,目前已飽和使用,無剩餘空間用於業務擴容,所以只能將大資料平臺進行跨機房搬遷和擴容。經分大資料主倉庫 PB 級的資料量、 15 萬張的表、每日庫內超過 3000 個作業以及日加工時間超過 16 個小時等客觀情況都為遷移工作帶來巨大挑戰。

解決方案  

經過周密計劃, GBASE 制定了 2 步驟的搬遷擴容方案:

1 、基於 GBase 8a 映象叢集實現資料複製,進行機房搬遷

 

通過 GBase 8a MPP 產品 V95 版本搭建跨資料中心的雙活叢集架構,在第六資料中心建立虛擬叢集 VC2 ,要求 VC2 與第五資料中心 VC1 的叢集規模、分片個數、 distribution hash map 完全相同,建立 VC2 之後通過映象關係開始叢集的全量資料同步,同時上層應用修改 JDBC 連線,開始訪問 VC2 Coordinator 節點,此時 VC1 datanode 節點仍然作為生產資料叢集對外提供資料服務。

 

當資料同步完成後將 VC2 Coordinator 向下訪問資料叢集修改為 VC2 datanode, 最終完成資料主倉的跨資料中心遷移工作。

此方案做到了業務應用的程式碼零改動,通過修改 JDBC 的連線串,重啟服務就完成了系統割接,真正意義上做到了經分大資料資料主倉完全業務無感知的跨資料中心搬遷工作。

2 、對搬遷完成後的叢集進行節點擴容,提升大資料平臺的儲存容量及計算能力

最終通過 7 天時間的資料重分佈完成了 PB 級資料由 72 節點到 158 節點的擴容工作,目前擴容後系統已良好執行超過 30 天。

價值體現

通過 GBase 8a MPP V95 版本的虛擬叢集功能,在虛擬叢集中將兩個同樣規模和資料分佈策略的子叢集建立映象關係來構建實時資料複製,可以構建大資料業務平臺實時雙活的容災方案。

通過山東移動大資料平臺主資料倉儲的成功遷移,驗證了通過虛擬叢集搭建雙活或容災架構的可行性,為其他預計搭建雙活或容災叢集的省公司積累了豐富經驗,也證明了 GBase 8a MPP 的產品力和南大通用的自主研發能力,為進一步助力中國移動數字化全面轉型添磚加瓦。

 

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69979120/viewspace-2854202/,如需轉載,請註明出處,否則將追究法律責任。

相關文章