TiDB 助力北京電信夯實電信賬務系統的資料底座

PingCAP發表於2024-11-25

電信賬務系統是電信運營商的核心繫統 BOSS(業務運營支撐系統)的核心部分,屬於電信行業最關鍵業務系統之一,承擔著使用者賬務處理、賬單生成和支付處理等核心職能。賬務系統的穩定和安全執行直接影響運營商的收入和使用者滿意度,任何系統故障都可能導致使用者服務中斷,進而引發經濟損失和社會影響。

作為電信行業典型的 HTAP(混合事務/分析處理) 應用場景,賬務系統不僅要高效地處理大規模線上事務,還需實時分析複雜查詢以支援業務決策

鑑於電信行業對穩定性和資料安全的高要求,核心資料庫系統必須具備極高的穩定性、可靠性、安全性和效能,同時擁有全面的容災能力,確保資料零丟失。隨著數字化轉型的深入,北京電信加大了關鍵核心技術的攻關,成功實施了核心系統資料庫的分散式改造,實現了從依賴 MySQL 分庫分表技術棧全面向國產分散式資料庫的自主可控轉型

圖片

計費賬務系統在運營商業務中處於核心地位,對資料庫穩定性和效能要求也極為嚴苛。面對傳統資料庫在效能上的嚴峻挑戰,選型的資料庫需要具備雲原生、分散式架構和高可靠性等關鍵能力。2023 年某省電信機房火災事故進一步凸顯了電信基礎設施所面臨的風險,電信集團將核心系統的高可用性提升至戰略新高度。在這樣的背景下,TiDB 透過了 POC 測試,被選為支撐該系統的資料庫。

北京電信原先基於 MySQL 和 MyCat 的分庫分表方案在業務耦合、資源利用、SQL 查詢最佳化、擴縮容和高可用性等方面存在明顯短板。MyCat 作為中介軟體實現了分庫分表,但其在以下方面表現不佳,包括但不限於:系統高可用性,系統靈活擴充套件性,開發透明性、線上 DDL、複雜 SQL 處理 、跨分片 JOIN 處理效能、非常複雜的配置維護。

圖片

北京電信賬務系統實施了兩地三資料中心的資料庫部署(包括北京亦莊、天津武清和北京酒仙橋),並採用了應用雙活的容災策略,滿足了金融級別的高標準要求。系統實現了資料零丟失(RPO=0)和故障秒級自動切換(RTO<60 秒),能夠同時支援交易和大型資料分析型應用的需求。這一實踐徹底解決了分庫分表方案在三中心高可用性方面的風險。北京電信賬務系統因此成為中國電信省分公司中的首個案例,能夠在任意資料中心出現故障時,確保資料不丟失並實現秒級業務切換,成為符合集團規範要求的典範。

圖片

北京電信賬務系統三中心高可用架構示意圖

北京電信自主研發的賬務容災管理平臺透過增強運維的介面化和自動化,實現了對系統執行狀態的實時監控。該平臺針對應用層、叢集層以及機房層的潛在故障,都預設了自動化的故障轉移和切換策略。在遇到故障時,業務能夠實現秒級無感知切換,從而保障了業務的連續性和使用者的服務體驗。

圖片

TiDB 採用存算分離的原生分散式架構,隨著實際業務需求的變化,可按需分別對計算節點或者儲存節點進行一鍵靈活擴縮容操作,且操作過程業務無感知。TiDB 的線上 DDL 機制透過並行 DDL 框架來實現線上的非同步變更,確保在執行 DDL 語句時不會阻塞其他會話中的 DML 語句,從而保證資料的一致性和正確性。

TiDB 投產後業務平均處理效能實現 30% 以上的提升,資料儲存空間由原先三副本 40TB 的儲存空間縮減至三副本 10TB,節省了 300% 的儲存成本。作為一款 HTAP 資料庫,TiDB 同時滿足了交易處理或大資料庫分析型的業務需求,徹底解決了分庫分表方案的分散式事務、大 SQL 大事務、維護複雜等問題。

圖片

在應用適配過程中,TiDB 與 MySQL 高度相容,實現無縫遷移,極大地降低了遷移成本。TiDB 的資料分片自動透明分佈,不需要分割槽鍵,避免侵入應用和程式碼的相關改造,同時解決了資料傾斜的問題。在資料庫遷移過程中,北京電信採用了資料遷移工具 DM,實現了全量和增量資料的遷移。首先,透過提前割接資料庫資料和歷史資料,成功減少了當晚資料割接的時間和風險。其次,透過最佳化流程,當晚需要割接的資料量大幅縮減至原來的 20%,大幅縮短了割接時間。最終,整個割接視窗的時間被控制在 4 小時內,確保了遷移過程的高效和平穩。

北京電信充分利用原生分散式資料庫的優勢,不僅提升了關鍵業務系統的執行效率,還加強了業務連續性的保障,實現了技術進步和整體降本增效的雙重目標。此次實踐進一步增強了北京電信在核心業務系統關鍵技術方面的自主創新能力,並推動了業務與管理的數字化和智慧化。展望未來,北京電信計劃與 TiDB 深化合作,探索更多關鍵業務場景,將合作擴充套件至更多電信省份的 BOSS 計費賬務等核心領域,服務電信業務的高質量發展。

圖片

正如在通訊產業網要聞中提到,TiDB 和應用開發商一起為北京電信災備方案升級迭代,重磅打造雙活容災方案,為賬務系統鑄就一層牢不可破的“金鐘罩+鐵布衫”:

*“金鐘罩”般的外在防禦*

全業務雙活,無縫對接:為賬務中心所有業務、資料和應用打造全面覆蓋的雙活執行,如同“金鐘罩”的堅固外層有效抵禦外在風險,當一方遇險時,備份立即補位,確保在任何情況下都能為使用者提供無間斷的服務。

資料零丟失,秒級復原:高效資料備份和恢復機制保障資料在兩地三中心間實時同步,一旦突發故障,系統能在極短時間內迅速切換並恢復服務,確保資料萬無一失、使用者體驗不受絲毫影響。

*“鐵布衫”般的內在堅韌*

故障自愈,智慧護航:提供自我修復和故障自愈能力,一旦檢測到異常,自動將業務流量引導至另一中心,確保系統和核心應用在遭受攻擊或故障時依然保持正常執行。

升級不停機,服務永續:在系統升級過程中,無需停機,同時也能持續為終端使用者提供無感知、連續性的服務,體現了雙活系統的韌性和可靠性。

國產資料庫,效能卓越:系統採用 TiDB 分散式資料庫,不僅滿足實時交易和大資料分析的需求,還具備線上擴容、無需分庫分表等多重特性,如同“鐵布衫”般堅固的底層支撐,為賬務系統的穩定執行提供了有力保障。

相關文章