專訪中歐財富伍春蘭:財富管理行業數字化轉型升級,資料庫如何選型?

發表於2023-09-20

以下文章來源於 InfoQ 數字化經緯。

InfoQ 數字化經緯:

InfoQ 極客傳媒旗下官方賬號。面向數字化管理者、從業者、洞察者,提供數字化企業案例、政策解讀、研究報告,做數字時代的「記錄者」。

作者 | 趙鈺瑩

嘉賓 | 伍春蘭 中歐財富技術總監

本文采訪了中歐財富技術總監伍春蘭,探討了財富管理行業數字化轉型面臨的挑戰,包括人才、安全和技術基礎架構。在資料庫遷移中,中歐財富透過採用分散式資料庫 TiDB 解決了 MySQL 的舊有問題,強調了 HTAP 融合架構在效能和資源管理方面的重要性。文章指出,數字化轉型需要跨足思維、組織、流程和平臺等層面,以適應日益高效和創新的需求。閱讀全文約需 12 分鐘。

本文要點:

  • 財富管理領域近幾年受內外部環境的變化,對技術底座能力提出敏捷高效、及時創新等較高要求;
  • 數字化轉型不是一個技術問題,涉及思維、組織、流程、平臺四大層面;
  • 財富管理領域企業數字化轉型主要面臨人才,安全、基礎架構(技術)三方面的挑戰;人工智慧技術在財富管理領域企業內部大規模落地還需要時間;
  • 在資料庫選型之前,企業需要先定位清楚需求;
  • 資料庫遷移前,舊有的 MySQL 體系主要遇到的問題是大表 DDL 耗時、分庫分表耗費大量人力、單節點寫入易出現瓶頸等問題,最後透過分散式資料庫 TiDB 解決了上述問題;
  • 在評價資料庫遷移前後的效果時注意運維、資源等隱形層面的成本;
  • HTAP 融合架構在效能、資源精準消耗等層面都起到了重要作用;

中歐財富數字化轉型升級的思路、難點及實踐

InfoQ:財務管理公司和基金公司這幾年節奏明顯變快,其背後的推動力到底是什麼?財務管理行業的數字化轉型存在哪些痛點?

伍春蘭 :最近幾年,基金公司內外部環境都發生了比較大的變化。自 2013 年伴隨著餘額寶的興起,整個網際網路業務快速發展,這對市場帶來了幾個明顯的變化: 第一個變化是 使用者基本盤迅速擴大,要想服務好使用者,技術迭代速度需要更快。舉例來說,一些網際網路屬性的公司資料重新整理較快,中歐財富為了達到這個效果,整個公司做了比較大的投入和配合,包括引入人工智慧技術做一些自動化的事情; 第二個變化是 網際網路業務比較有特點且資訊較為透明,使用者可以迅速看到市場上出現了哪些新的業務與渠道,這要求團隊時刻保持敏捷和高效,包括與上下游業務的打通; 第三個變化是 業內開始出現新的營銷形式,比如透過直播的方式進行營銷,或者運營新的平臺,比如抖音等,這需要企業打通內部的運營流程和資料,這對技術團隊提出的要求同樣是及時創新、敏捷高效。

綜上,公司需要抓住機會,迅速做出決策,以應對這些變化。比如,打破原來的資料孤島,形成統一的、智慧的資料中臺,基於這個中臺可以更好地挖掘客戶特性、繪製使用者畫像,從而讓產品更好地滿足客戶需求;與上下游的機構和企業合作時需要具備強大的研發能力,包括模型、演算法、定製化能力等都必須與網際網路大廠的研發實力相匹配。

縱觀內部和外部,難點主要在於:一是人才方面,並不是每一家金融企業都匹配了強大的且對技術趨勢敏銳的研發團隊;二是資源投入能力,比如產品層面的投入是否跟得上;三是資料安全,在適配網際網路快節奏的業務更新和及時響應的前提下保證公司內部、與上下游企業合作全鏈路的資料安全是非常重要的;四是在舊有基礎架構上做敏態升級,包括基礎設施、運維、研發、產品等。

InfoQ:第二大變化中的“打通上下游”具體指什麼?

伍春蘭: 數字化轉型一是思維、二是組織、三是流程、四是平臺。思維上,數字化轉型不是某個部門的事情,過程中涉及組織及流程上的變化,需要保證大家思維統一;組織和流程上,資料打通就涉及跨部門共享,思維對齊的情況下還需要保證組織層面可以儘可能流程化,快速推動相關決策。比如新業務上線,可能涉及運營、產品、研發等多個部門,大家是否可以透明地瞭解整個執行鏈路,清楚瞭解公司的決策背景,只有每個部門都參與其中才能真正做到流程提效,而不僅是完成工作。平臺上,資料打通之後能否真正用起來,資料質量需要達到什麼程度都是平臺要重點最佳化的事情。

InfoQ:針對人才,安全、基礎架構三大難題,中歐財富是如何解決的?

伍春蘭: 在人才方面,中歐財富於 2014 年左右開始籌備,招聘的大多數員工背景偏網際網路和核心金融機構方向,這些員工不僅瞭解金融的業務形態,同時具備較高的技術能力和敏銳度,整個架構起初就適配了網際網路時代的特點;安全層面,除了符合國家相關監管規範的要求,中歐財富本身也做了大量探索,比如防 DDoS 攻擊、流量清洗、內網監控、資料安全和審計等,這些能力經過過去三四年的發展逐漸建立起來,但要做到完全自動化還是比較困難的。基礎架構層面,如前文言,初始架構已經適配了網際網路時代的特點,在過去多年的演進中,中歐財富又針對不同的模組進行了最佳化,包括分散式資料庫體系建立、私有云體系最佳化等。

InfoQ:您方便舉例說明中歐財富透過數字化轉型取得了哪些成果?

伍春蘭: 以投顧業務為例,首先該業務需要迅速理解客戶需求,並基於資料驅動的邏輯做出快速、敏捷的反應,這對底層的資料能力要求較高;其次,作為國家首批五家基金投顧業務試點公司,中歐財富主要優勢在於強大的自主研發能力。過去五年,中歐財富針對整個基礎架構進行了升級,底層基建與行業技術演進的大趨勢相匹配,實現了軟體定義及彈性部署,降低了計算和運維成本。目前,公司業務全面部署在基於 K8s 的私有云上,可以很好地支援投顧等業務的發展。

InfoQ:如何看待人工智慧技術在財富基金領域數字化轉型中發揮的作用?

伍春蘭 :對於人工智慧技術的落地,我認為大規模落地還是有難度的。雖然目前很多公司在這方面都有動作,但更多的是嘗試,比如智慧客服、敏感詞稽核等。在實際業務中,人工智慧更多是在扮演輔助的角色,而不是代替很多人的勞動。

具體到金融領域,因為該領域強監管且對專業性要求較高,因此目前現有的、通用型的大模型可能無法很好匹配需求,未來可能會出現針對該領域的大模型,只是還需要一些時間。

面向未來,中歐財富如何聯手 PingCAP 打造分散式資料庫體系?

遷移前的舊有資料庫體系基於 MySQL 搭建

InfoQ:中歐財富在與 PingCAP 的 TiDB 資料庫合作之前,內部的資料體系是什麼狀態?

伍春蘭: 在此之前,中歐財富的資料庫體系是基於 MySQL 搭建的。隨著業務的逐漸發展,傳統的資料體系遇到了一些問題,中歐財富開始思考是否存在一些新的工具、平臺、產品可以更好地滿足目前的訴求。

在技術層面,團隊當時面臨著三大比較明顯的問題:一是大表的 DDL 操作,該操作一般透過 gh-ost 工具去實現,非常耗時,且會產生大量 binlog 影響下游的同步。如果遇到有分表邏輯的大表,整個 DDL 過程需要持續幾天;二是分庫分表,單表資料量增速非常快,時常需要進行分表處理。但開發資源有限,沒有這麼多人力可以投入到分表工作中;三是單節點寫入,MySQL 傳統的一主多從架構,主節點承擔應用的寫入。當有清算或跑批任務時,主節點會出現寫入瓶頸。

分散式資料庫選型及遷移

InfoQ:在分散式資料庫選型層面,中歐財富主要看中哪些因素?

伍春蘭: 中歐財富在資料庫選型層面主要看中整個架構的高可用性、去中心化、效能高且沒有單點故障以及可以降低運維成本。以單點效能為例,雖然 MySQL 時代可以透過增加機器的方式來解決問題,但總體無法實現彈性擴充套件。經過對一些網際網路公司資料庫選型的調研,以及對市面上現有資料庫產品的瞭解,最終團隊抱著“試一試”的心態開始接觸 TiDB。

img

選型確定後,研發團隊對 TiDB 的穩定性、可用性、擴充套件性等進行了半年左右的測試,整個平臺都放到了 TiDB 之上,包括核心業務,綜合體驗其對場景的適配情況。其實,資料庫是一個非常複雜、龐大且核心的工程,且需要與時俱進。TiDB 在當時提出的存算分離等理念與場景能力特別匹配,且經過多方交流,其架構足以承擔未來多年資料量的持續增長。

InfoQ:中歐財富的資料庫遷移主要分了哪幾步?

伍春蘭: 中歐財富從 2021 年開始進行調研、測試,2022 年開始部署、上線,並於今年進行深度測試並完成 30% 的業務遷移,包括組合投顧系統、營銷系統、產品系統、使用者系統和交易系統,未來希望可以實現全量業務執行在 TiDB 之上。

回頭來看整個過程,中歐財富的方法還是比較科學的。一是,企業需要對當前的情況有充分認知,清晰定位需求並匹配合適的產品;二是團隊需要充分印證升級後的資料庫整體架構,對未來演進有明確的方案;三是培養人才,中歐財富和 TiDB 團隊做了大半年的密切交流,並在其社群中學習,對其技術能力、研發能力、現有市場、可預見的協同、定位、技術演進方向等都有了充分了解;四是準備備案,即雙輪驅動。起初,業務在 TiDB 和舊的 MySQL 體系上同時執行,這種模式下運轉了大半年之後,整個技術架構完成了較好適配(當然,TiDB 本身相容 MySQL 協議),業務運轉良好後開始進行正式遷移,雙方團隊一起完善新老架構的相容及下游系統適配。遷移過程中,下游不會感知到上游的架構變化,團隊做了充分的準備並嚴格按計劃執行。

img

生產 TiDB 叢集配置如上圖,為了應對複雜的業務場景,硬體層面都選擇了超配。架構方面,計算層用了 5 臺伺服器,其中 3 臺 TiDB-server 和 PD 混合部署,另外 2 臺用於接收復雜 SQL 的請求(資源隔離)。每臺 TiKV 伺服器下掛三塊盤,每一塊盤都作為一個獨立的 TiKV 節點,所有 TiKV 一共有 3*3=9 個節點。叢集架構可見下圖。

img

遷移後的整體評價

InfoQ:您對於資料庫體系更換的整體評價是什麼?

伍春蘭: 一是敏捷性,不需要在資源分配層面投入過多精力,可以更快推行創新業務;二是簡化了公司架構,統一資料庫架構之後降低了運維難度和升級換代的難度;三是 HTAP 架構下的一些計算任務的鏈路縮短,風險相對更加可控;最後是有利於未來的業務創新和增長。

具體到技術層面, TiCDC 簡化了資料同步 ,TiCDC 可以將 TiDB 內的資料同步至 MySQL 和 Kafka (canal - json 格式),大大降低了資料同步的改造工作; 可觀測性 ,配套的 dashboard 和 grafana 非常好用。測試階段遇到問題或效能瓶頸,可以快速地定位出問題,加大測試的效率; 伺服器硬體故障 ,叢集內伺服器硬體故障導致當機,沒有影響任何業務;後續配件更換的停機流程也非常絲滑; Tiflash 最佳化模糊查詢 ,業務有模糊查詢的需求,透過 TiFlash 將行存資料轉為列存,同時利用 MMP 對查詢進行加速。

InfoQ:從運維角度來看,遷移前後的成本發生了哪些變化?

伍春蘭 :整體來看,運維層面還是節省了很多成本。舉例來說,原有體系需要拆分出大量叢集來運營數十個應用,現在只需要一個 TiDB 叢集就可以解決問題,這種運營和計算資源(伺服器等)成本是隱形的,因此整個遷移過程已經滿足降本增效了。當然,很多企業可能足以承擔這些成本,但運營效率也是不同的。更換之後,運營效率、架構敏捷度得到了極大提升,這在當前的業務場景下至關重要。

那麼,為什麼前幾年企業不談這些內容呢?在非網際網路、非充分競爭的情況下,這些問題可能不是最關鍵的,靠人力驅動也可以搞定。但是,現在的市場環境下,效率在很多時候起決定性作用,這就逼得很多企業不得不對舊有的資料體系做出調整,而且企業不需要在糾結底層的選型和適配問題,資源全部池化,企業可以把所有精力投入到業務本身來獲取最終的增長。

InfoQ: 研發同學對於 TiDB 有哪些使用反饋?

伍春蘭: 從研發視角,首先我們對自己有清楚的認知才選擇了 TiDB;其次,如上所言,運維難度和成本的降低是可以感受到的;再次,大廠倡導的分庫分表技術肯定是成熟的,但對小企業來說,這帶來的工作量是巨大的,在研發資源有限的情況下,這其中的成本不得不考慮;然後,業務需要及時、彈性,TiDB 的擴充套件能力讓這一點成為可能;最後,TiDB 的 HTAP 融合架構解決了很多,以往的大批次資料計算任務對資源消耗極大且執行速度很慢,TiDB 在跑這類任務時資源隔離的情況下還能做到智慧路由,資源隔離可以保證多個業務可放入一個叢集,每個業務配置指定的 RU ,保證業務之間不會相互干擾。遇到突發流量,也可以控制爆炸半徑,幫助精準判斷資源消耗,而且效能非常好,這對業務發展非常重要。

未來計劃

InfoQ:未來的遷移計劃是什麼?

伍春蘭: 整體規劃是今年完成 70%-80% 的業務遷移,目前已基本完成前期籌備工作。如果進展再快一些,今年底到明年初預計可以完成 90% 的業務遷移,基本涵蓋整個網際網路所有的核心業務。希望在市場新的機會到來之前,整個底層平臺能力準備充分。我相信,未來是有廣闊前景的。

在技術層面,未來會嘗試用 TiProxy 替換 Haproxy 或 F5 ,能夠保證叢集無損升級,提供限流、熔斷等高階功能,未來可以抓取所有 SQL,實現流量重放,提高測試效率;功能整合,將 Dashboard、TiUniManager、DM-web,甚至 TiCDC 的管控集中在一個平臺,該平臺還能提供備份管理、告警調整等輔助功能;巡檢功能,很多時候要靠人去分析 Dashboard 和 Grafna 的 Performanceoverview 來判斷叢集情況。巡檢功能可以省去人力開銷,依託 AI 給出準確的叢集執行報告,並附上相關最佳化建議。

關於中歐財富

中歐財富成立於 2015 年 8 月 14 日,是中歐基金控股的銷售子公司,持有中國證監會核准的基金銷售業務牌照。旗下 APP 基本實現業內基金品種全覆蓋,併為投資者提供基金交易、大資料選基、智慧定投、理財師諮詢等專業便捷的投資工具及服務,致力為投資者及合作伙伴提供一站式網際網路財富管理解決方案。中歐基金是中歐財富的股東,中歐財富與股東之間實行業務隔離。

相關文章