用“極速統一”,開啟金融行業資料分析新正規化

伺服器頻道發表於2023-01-13

資料庫作為金融資訊系統的核心基礎設施,歷經數十年發展,為金融行業轉型升級提供了有力的技術支撐。同時,以銀行為代表的金融行業是資料庫銷售額佔比最高的市場,也是對資料庫技術依賴度最高、要求最嚴格的市場。

據統計,2021中國資料庫市場行業分佈中,金融佔20.2%,政府佔18.4%,網際網路14.8%,運營商8.9%。IDC 預測, 2024 年全球數倉的市場規模將達到 297 億美元,2019-2024 年的年複合增長率將達到12%,其中雲上的數倉市場規模將達到 181 億美元,2019-2024 年的 CAGR 將達到 25.3%。預計 2024 年,中國數倉市場的規模是 168.5 億元,中國大資料平臺軟體市場規模總體為 352.9 億元,中國分析型資料庫的整體市場將達到 521.4 億元,複合增長率為 27.7%。

以往商業集中式資料庫憑藉較強的功能黏性、優秀的系統穩定性、良好的軟硬適配能力,一直在金融行業佔據較大份額。而網際網路金融的異軍突起,帶來了高併發、海量資料、超高峰值等挑戰。為了應對這些實際場景,近年來各金融機構紛紛進行了關於資料庫的探索,並結合金融交易場景不斷推陳出新,拉動資料庫技術的迭代發展。

傳統IT系統無法滿足金融交易要求

信通院在去年釋出的《金融級分散式資料庫白皮書》中指出,金融行業普遍對資料庫的安全性、可靠性、穩定性有著全行業最為嚴苛的要求,因此,滿足金融行業需求的金融級資料庫產品幾乎成為所有行業中的標杆。報告認為,金融級分散式資料庫是能夠滿足金融級要求的高可用、高效能、低成本、線性水平擴充套件、企業級安全、便捷性運維的分散式資料庫。

在眾多金融級分散式資料庫中,按照資料處理方式,大致可以分成兩大類:聯機事務處理OLTP(On-line Transaction Processing)、聯機分析處理OLAP(On-line Analytical Processing)。OLTP是傳統的關係型資料庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。OLAP是資料倉儲系統的主要應用,支援複雜的分析操作,側重決策支援,並且提供直觀易懂的查詢結果。

可見,OLAP資料庫擁有高效能、可擴充套件、高可用和高容錯等特性,因此在金融行業的應用規模有了明顯的提升,並且正在從金融外圍系統向核心業務延伸,有力支撐著金融行業的數字化轉型。在過去幾年中,我國資料庫市場 “百花齊放”,包括傳統資料庫廠商,如達夢、人大金倉、神州通用;雲廠商,如阿里雲、騰訊雲、華為雲;新興資料庫廠商,如StarRocks、PingCAP、星環科技、OceanBase;ICT跨界廠商,如新華三、浪潮。這些廠商的資料庫產品和方案,正在各大商業銀行、金融機構及城商行的核心業務系統中投入使用並穩定執行,滿足了金融行業核心業務系統對資料庫的要求。

接下來我們來看兩個實際案例,希望能為更多金融行業使用者的轉型帶來借鑑和參考價值。

中原銀行和眾安保險邁入極速統一時代

中原銀行是河南省唯一一家分支機構網點覆蓋全省的省屬法人銀行,在全國城商行中的排名位列第 8 位,是河南首家資產超萬億的城商行。隨著業務不斷擴張、資料量的高速增長以及業務邏輯複雜程度的不斷提升,中原銀行需要快速響應客戶需求,為其提供更加精準的服務,同時藉助實時資料進行客戶洞察,幫助銀行業務人員做出業務決策,提高管理水平。

為此,中原銀行搭建了一站式商業智慧BI平臺,該平臺分為客戶行為分析系統知秋、一站式報表平臺魯班、一站式大屏平臺鴻圖和自助分析平臺雲間四大應用系統,總使用者超過一萬人。為支援BI平臺的快速高效工作,中原銀行搭建了完整的資料平臺。其中,該平臺的儲存計算層分為資料湖、離線數倉與實時數倉三部分,由實時數倉對實時資料進行處理,輔助進行實時決策。隨著使用者的增加,基於原有的資料平臺架構,僅能支援T+1小時級別的準實時報表,難以滿足銀行在客戶分析、風控管理等場景下的實時查詢與分析需求。此外,原有資料平臺流批鏈路複雜,運維成本高,且實時資料與離線資料的儲存並不統一,存在冗餘,造成存算資源的浪費。

為了提高資料平臺的查詢效率,深入挖掘實時資料的價值,提升實時響應能力,中原銀行調研了市面上兩款主流OLAP資料庫產品,發現ClickHouse在單表查詢和大寬表查詢表現優秀,查詢延遲也比較低,但是Join效能較差,且不易維護;StarRocks在固化查詢和靈活分析效能表現不錯,多表查詢效能也比較優秀,而且同時支援實時與離線匯入分析場景。與此同時,StarRocks具有流批一體、向量化執行、運維簡單、查詢效率高、相容性好且能夠滿足高併發查詢要求等六大優勢,恰好滿足了中原銀行構建極速統一的資料分析架構的業務需求。

(中原銀行基於StarRocks的實時數倉建設)

目前,中原銀行使用StarRocks完成了固定報表遷移、知秋系統改造與實時數倉建設,儘可能提高了銀行的資料匯入、查詢與分析效率。遷移完成後,固定報表查詢效率提升為原來的2.7倍,所需時間下降到3秒以內;原耗時排行top10的報表,查詢效率最佳化了10倍以上,同時還實現了自助客戶行為分析。更值得一提的是,實時數倉架構將中原銀行的離線資料和實時資料進行了統一,減少了資料的冗餘,同時支援秒級的匯入與查詢,提高了業務的時效性和多樣性。

目前,中原銀行使用StarRocks完成了固定報表遷移、知秋系統改造與實時數倉建設,提高了銀行的資料匯入、查詢與分析效率。遷移完成後,固定報表查詢效率提升為原來的2.7倍,所需時間下降到3秒以內;原耗時排行top10的報表,查詢效率最佳化了10倍以上,同時還實現了自助客戶行為分析。更值得一提的是,實時數倉架構將中原銀行的離線資料和實時資料進行了統一,減少了資料的冗餘,同時支援秒級的匯入與查詢,提高了業務的時效性和多樣性。

(中原銀行基於StarRocks的業務價值提升)

眾安保險是中國首家網際網路保險公司,不設任何分支機構,完全透過網際網路展業。截至2021年底,眾安保險服務超過5億使用者,累計出具約427億張保單。

眾安專注於應用新技術重塑保險價值鏈。在“保險+科技”雙輪驅動下,眾安將自身沉澱的保險科技能力和先進的商業模式向行業輸出,將資料作為支撐整體數字化路徑的基石,從看見到預見、從名單到客戶、從運營到創新,每一個環節和每一次升級都離不開資料賦能。

(眾安保險的數字化路徑)

在數字化轉型的程式中,多場景融合的精細化分析是數字化轉型破局的關鍵,但眾安遇到了一些困難,包括單一場景分析遭遇瓶頸、多場景資料分散嚴重和資料能力缺乏向業務層擴充。針對這些問題,眾安建立了“集智平臺”。目前在眾安保險內部各業務線和部門,超過3000人都在使用集智平臺,平均日活可達2000+。

集智上線後採⽤的是 ClickHouse,但隨著使⽤平臺的⽤戶⽇漸增多,業務⽅需要查詢的資料量也越來越⼤,業務場景變得複雜後,很多特定場景 ClickHouse 的表現都不夠理想:在多併發場景的查詢效能下降嚴重、多表關聯查詢效能⽋佳、排查運維成本較⾼、需要藉助第三方工具等。針對實時場景,集智平臺在使⽤ ClickHouse 的 Replacing 引擎中也遇到了查詢慢、不⽀持資料的刪除、只能對同一分⽚上同一分割槽的資料去重等痛點。

(眾安保險集智平臺介紹)

基於以上情況,集智平臺需要進行新的 OLAP 技術選型。經過選型評測發現,StarRocks支援高併發,部分場景可支援高達1萬以上的QPS,TP99可以控制在1秒以內。StarRocks透過CBO最佳化,可以自動選擇高效能的查詢計劃,多表關聯效能的表現也更好。

因此,眾安保險在集智平臺引入了 StarRocks,支撐理賠風險洞察、精細化運營分析、營銷實時效果追蹤等方面的應用,賦能戰略決策人員、財務企劃人員、營銷管理人員、資料運營人員、資料分析人員。為了提升集智在查詢載入方面的效能,同時將StarRocks極速查詢及高併發相關能力更好地賦能給業務,集智在產品側深度整合了StarRocks,使用者可以在平臺上快速完成一站式的統一實時看板搭建。

透過引入StarRocks,眾安保險集智平臺解決了極速查詢和高併發等資料問題,提升了集智平臺整體的資料支援能力和市場競爭力。以保險產品中線上渠道投放場景為例,當保險產品開始對外發售前後,市場人員會將產品投放到多個渠道進行推廣曝光,透過經營的核心報表實時核算每個渠道的投放成本以及其對應的ROI,根據資料表現情況實時調整投放策略,控制渠道營銷流程中的獲客單價和投放費用。因此資料反饋的快慢也會決定業務人員在定位問題、調整策略等事件上是否佔據最恰當時機。

透過中原銀行、眾安保險這兩個案例可以看到,作為新一代極速全場景MPP資料庫,StarRocks 具有可伸縮性、高可用、高效能、優秀的價效比等優勢,在提升企業的業務價值方面深具潛力。

極速統一3.0 助力資料要素價值充分釋放

大資料技術應用於企業級資料基礎設施已不鮮見,而金融行業在實踐層面一直走在行業前列,它們在資料湖、融合數倉等典型的技術場景不斷探索,逐步將先進的大資料生態技術應用到風險控制、運營管理、信貸查詢、信用卡徵信和財務分析等業務場景。

比如中國銀行就於2021年投產上線資料湖平臺,希望為中國銀行統一資料分析層、展現層、資料沙箱等探索提供平臺支撐,以及沉澱和深度挖掘全行資料資產。中國建設銀行則早早把資料倉儲和資料湖作為資料底座,不同於不少企業基於Hadoop體系的湖倉建設,透過一體化架構設計、一體化湖倉直訪、一體化資料檢視、一體化資產管理,形成了具有自身特色的湖倉技術體系。

透過對金融、遊戲、製造等行業的深入洞察和技術共創,過去一年, StarRocks 不斷打磨產品的功能、效能、穩定性,修改了 80 多萬行程式碼,釋出了近 50 個版本。而在今年 9 月的 StarRocks Summit Asia 2022 上,StarRocks 社群正式釋出了StarRocks 極速資料湖分析,開啟極速統一3.0時代。

(StarRocks 2.4 在 SSB單表、SSB多表、TPC-H三個標準測試集下,相比於去年同期,效能提升了50%-80%。在物化檢視、資源隔離、Query Cache、自動化資料分佈、匯入最佳化等各個核心功能均有重大突破)

StarRocks 認為,極速資料湖分析就是為使用者提供效能堪比資料倉儲的資料湖分析。在整個架構層面,當前StarRocks 的資料湖分析已經具備了存算分離、彈性伸縮的能力。在儲存層,資料支援按照Apache Hive、Apache Iceberg、Apache Hudi等主流表格式維護在物件儲存之上。在計算層,從查詢生命週期來說,StarRocks的無狀態計算節點compute node,已經可以負責從掃描到聚合的全部計算任務;在控制層,FE 統一接入各類主流資料湖的後設資料,並對湖上查詢請求進行統一排程和規劃。使用者透過StarRocks進行資料湖分析,一方面能夠享受存算分離、彈性伸縮等前沿技術帶來的降本增效,另一方面,無需資料匯入即可享受到堪比數倉分析的極速效能體驗,更加敏捷地從資料湖中獲取靈感和洞見,驅動業務增長。

人民銀行今年釋出的《金融科技發展規劃(2022-2025年)》中提出了八大重點任務,明確到2025年,金融科技整體水平與核心競爭力實現跨越式提升,資料要素價值充分釋放、數字化轉型高質量推進、金融科技治理體系日臻完善、關鍵核心技術應用更為深化、數字基礎設施建設更加先進。其中,資料庫一直是金融行業持續創新的重點領域,湧現出了大批的熱點技術和產品。而資料庫產品無論選擇哪條技術路線,目的都是要滿足高可用容災、資料一致性、業務連續性和系統可擴充套件等方面的要求。

面對金融級高要求,基於“極速統一”的資料分析新正規化打造出的MPP資料庫StarRocks,可以全面提升資料處理和分析的效能,將複雜分散的既有架構融合為簡單一致的嶄新架構。相信隨著金融行業數字化轉型的持續加速,StarRocks必將應對更多的複雜查詢、高併發、實時分析等場景,幫助使用者實現資料價值最大化。

來自 “ 廠商動態 ”, 原文作者:廠商動態;原文連結:廠商動態,如有侵權,請聯絡管理員刪除。

相關文章