作者:四川省農村信用社聯合社 張朝輝 桂俊鴻
來源:《金融電子化》
隨著四川省聯社黨委提出“合規銀行、智慧銀行、主力軍銀行”三大銀行戰略。作為四川省業務規模最大的銀行業金融機構、全國農信系統“排頭兵”的四川農信積極響應,率先於 2018 年 9 月完成智慧銀行 IT 架構藍圖,確定由集中式向分散式全面轉型的 IT 戰略方向,並創新構建分散式架構轉型的關鍵基礎平臺——“蜀信雲”。
耕耘近一年,“蜀信雲”平臺已正式投產上線,截至 2022 年,已支援智慧營銷、智慧櫃面等近 50 個關鍵業務系統的安全穩定執行。 “蜀信雲”平臺採用自主可控的分散式架構,原生分散式資料庫 OceanBase 作為關鍵支撐,保障四川農信普惠金融業務不間斷執行,為數字化轉型升級持續提供數字化底座能力。
夯實底座,“原生”蓄勢
資產規模、存款規模位居全省同業第一的四川農信,資料規模龐大,是全國極少數採用海外大型機的地方性金融機構,大型機雖然穩定但維護成本居高不下,技術可控性弱。隨著智慧銀行的推進,四川農信線上業務高速增長,尤其是助農直播帶貨的開展催生促銷、秒殺等新的流量高峰場景,導致系統頻繁應對高併發,傳統集中式資料庫難堪重負。
四川農信於 2018 年啟動分散式架構轉型之初,針對分散式資料庫領域進行過大量的對比研究與詳細的場景測試。 總的來說,分散式資料庫可歸總為三條技術路線:第一條,“分散式中介軟體+單機資料庫”;第二條,“透過構建分散式共享儲存實現擴充套件,採用非對稱計算節點”,大部分公有云資料庫採用該路線;第三條,“原生分散式資料庫”。
在這三條路線中,“原生分散式資料庫”更符合業內對分散式資料庫發展方向的主流選擇,“分散式中介軟體+單機資料庫”只是一種過渡方案。“原生分散式資料庫”在架構解耦、應用遷移成本、分散式事務能力、擴充套件能力、強一致性和高可用性方面都有顯著的優勢。OceanBase 原生分散式資料庫憑藉首創“三地五中心“城市級故障自動無損容災新標準、連續 10 年穩定支撐 “雙 11“等亮眼實力,走進了四川農信的視野;同時具備支撐四川農信“多地多活單元化”目標架構實現的能力,能滿足四川農信對分散式資料庫的諸多嚴苛要求。
分散式資料庫雖然是未來的發展方向,但目前大多數分散式資料庫在穩定性、SQL 相容性、最佳化器成熟度等方面與傳統單機資料庫還有一定差距。銀行業在存量應用遷移過程中應該做到“規範先行”,例如,事前做好評估和測試工作,規範資料庫設計,在開發過程中儘量使用標準 SQL,減少遷移適配難度。特別是將應用從傳統單機資料庫遷移至分散式資料庫過程中會遇到相容性或效能方面的問題,因此,選型分散式資料庫時應優先考慮 Oracle/MySQL 等傳統資料庫相容性指標。OceanBase 的相容性位居中國分散式資料庫廠商前列,這也是四川農信最終選擇其作為數字化底座最重要的原因之一。
先行“蜀道”,攻堅克難
作為國內最早一批開啟分散式架構轉型的地方性金融機構之一,四川農信將架構轉型分為“立規劃”、“搭平臺”、“築中臺”、“擴應用”四個階段,預計 10 年時間完成由集中式向分散式的全面轉型。同屬農村商業銀行,IT 架構全面轉型難度堪比攀“蜀道”,原因一方面是 IT 投入規模上的制約,一方面是人、物、技術等方面的挑戰。四川農信已應用實踐原生分散式資料庫近 5 年,總結出以下四個階段經驗:
第一個階段:選型測試,奠定基礎。 四川農信啟動全行架構轉型工作後,隨即啟動分散式資料庫的選型工作,從技術路線、ACID 支援能力、容災指標、效能表現、開源生態、服務能力等方面綜合對比後,選擇最適合四川農信的分散式資料庫軟體產品。
第二個階段:做好頂層架構設計和規範。 確定全行級業務資料單元化拆分規則和切換策略,規劃全行資料庫叢集和部署計劃,制定分散式資料庫開發規範並組織規範落地檢查。
第三個階段:採用先試點後推廣策略。 前期,透過在智慧貸款、智慧渠道、智慧營銷、開放銀行、員工中心等不同型別的應用系統中試點使用分散式資料庫,充分驗證分散式資料庫能力,及時調整和最佳化使用方式,更新開發規範。
第四個階段:關鍵應用場景,集中力量重點突破。 核心賬務系統這類關鍵應用系統對資料庫的要求最為嚴苛,其可靠性、強一致性和高可用性關乎客戶資金安全和全行聲譽,是資料庫應用過程中“最難攻克的堡壘”。對於這類應用系統,四川農信前期會進行大量的技術調研和可行性論證,組織多輪的外部專家評審;同時,透過設計及驗證專案進行真實環境下的原型驗證,對關鍵難點問題進行逐一驗證,包括資金安全、端到端資料一致性、效能表現、多活容災、彈性擴充套件、運維監控等方面。
目前,OceanBase 憑藉資料強一致、高擴充套件、高可用、高價效比、高度相容 Oracle/MySQL 等能力,已覆蓋四川農信包括智慧貸款業務、櫃面渠道、開放銀行、企業網銀、智慧營銷、員工中心等銀行重要業務場景,基本涵蓋銀行渠道、產品服務、公共基礎服務、內部管理等業務領域。
第一,在效能方面, 業務處理效能顯著提升,可支撐業務整體吞吐量達到萬級 TPS;
第二,在可用方面, 業務不間斷、高併發訪問能力顯著提升,原生分散式資料庫的彈性伸縮、快速水平擴充套件能力,四川農信可從容應對春節、“開門紅”、“雙 11”等業務高峰,保障業務系統穩定執行;
第三,在運維方面, OCP 提供的白屏化運維監控能力可以高效、便捷管理資料庫,極大提升運維管理效率和監控告警能力;
第四,在國產化升級創新方面,OceanBase 原生分散式資料庫可執行在 X86 及 ARM 架構伺服器上,支援一庫多芯軟硬體混合部署,既能有效支撐主機下移,還具備多技術路線穩步推進國產化升級改造支撐能力,符合四川農信國產化升級履行穩步推進,守正創新的戰略需求。
“多地多活”容災架構,資料零丟失
四川農信原有容災架構以西信機房為主資料中心、科華機房作為災備資料中心,災備能力有限。 積極探索“兩地三中心”,同城雙機房採用主備模式,應用訪問主資料庫進行資料寫入,異地機房非同步複製進行資料同步,備份節點資料非強一致,本質上只能做到機房級容災,無法實現城市級容災。
2022 年 5 月,四川農信開啟“多地多活單元化架構”升級專案,目前,四川農信已按國家 A 級機房標準建成中西部銀行業規模最大的石牆資料中心。
“三地四中心五節點”的“多地多活”容災架構設計在成都、雅安、瀘州部署五個邏輯 Zone:成都同城部署兩個資料中心,一個石牆資料中心,一個西信資料中心;雅安同城部署兩個邏輯資料中心,雅安 1 資料中心和雅安 2 資料中心;瀘州黃艤作為距離較遠的災備中心,一般不承載業務流量,“4 個邏輯中心”能夠同時向外提供業務服務。待完全建成後將具備以下能力:
- 城市級業務負載能力。 “4 個邏輯中心”(即石牆、西信、雅安 1、雅安 2)各按 25% 的比例承擔業務流量,黃艤節點除部署資料庫選舉節點外,還部署“熱備”應用,一旦出現成都、雅安同時故障的場景,可快速、彈性的將業務流量切換至黃艤。
- 節點級多活容災能力。 當石牆、西信、雅安 1、雅安 2 任一節點發生故障,故障節點的業務流量可以在 20 分鐘內切換至另外三個節點之一,無資料丟失。黃艤節點正常無流量,當其發生故障對交易和資料無影響。
- 城市級多活容災能力。 成都、雅安任一城市發生災難的情況下,災難城市兩個節點的業務流量可在 20 分鐘內切換到另一個城市的兩個節點,無資料丟失。瀘州正常無流量,當其發生災難時對交易和資料無影響。
由“兩地三中心”容災架構升級至“三地四中心五節點”的“多地多活”容災架構,原生分散式資料庫優勢結合雲原生負載均衡和單元化的能力,四川農信將在業務面對重大災難(如城市級災難)時顯著提升安全性與韌性。 以往,容災主備切換準備和操作過程需要數個小時,待完全建成後,流量在不同單元不同站點間的調撥將僅需分鐘級即可完成。在資料庫層面實現同城 RPO=0,RTO<30s 的自動無損容災效果,達到國家金融行業最高等級容災標準。
目前,依託分散式架構全面轉型成功,四川農信數字化轉型已取得階段性勝利,為貫徹落實科技發展“十四五”規劃,四川農信將繼續牢牢把握數字化轉型機遇,緊跟金融科技發展趨勢,不斷深化智慧銀行建設,全面提升四川農信業務賦能水平,為四川省經濟發展貢獻金融科技力量。
未來,一是加快推進“三地四中心五節點”、“分散式核心”等資訊科技基礎建設,進一步提升容災能力、一體化運維、分散式多活、容量自動化管理能力,有效支撐快速響應業務的需求能力。
二是依託雲端計算、人工智慧等技術,推進信貸、支付等十大領域的資訊系統建設,全面提升獲客、渠道、產品、風控、運營和管理六方面的數字化服務水平。
三是依託大資料等技術,加快推進資料能力增強專案建設,深化資料質量整改,加強資料分析、加工、賦能水平,充分挖掘資料價值,有效釋放資料潛能,全面提升業務辦理的智慧化水平。