用“極速統一”,開啟金融行業資料分析新正規化
資料庫作為金融資訊系統的核心基礎設施,歷經數十年發展,為金融行業轉型升級提供了有力的技術支撐。同時,以銀行為代表的金融行業是資料庫銷售額佔比最高的市場,也是對資料庫技術依賴度最高、要求最嚴格的市場。
據統計,2021中國資料庫市場行業分佈中,金融佔20.2%,政府佔18.4%,網際網路14.8%,運營商8.9%。IDC 預測, 2024 年全球數倉的市場規模將達到 297 億美元,2019-2024 年的年複合增長率將達到12%,其中雲上的數倉市場規模將達到 181 億美元,2019-2024 年的 CAGR 將達到 25.3%。預計 2024 年,中國數倉市場的規模是 168.5 億元,中國大資料平臺軟體市場規模總體為 352.9 億元,中國分析型資料庫的整體市場將達到 521.4 億元,複合增長率為 27.7%。
以往商業集中式資料庫憑藉較強的功能黏性、優秀的系統穩定性、良好的軟硬適配能力,一直在金融行業佔據較大份額。而網際網路金融的異軍突起,帶來了高併發、海量資料、超高峰值等挑戰。為了應對這些實際場景,近年來各金融機構紛紛進行了關於資料庫的探索,並結合金融交易場景不斷推陳出新,拉動資料庫技術的迭代發展。
傳統IT系統無法滿足金融交易要求
信通院在去年釋出的《金融級分散式資料庫白皮書》中指出,金融行業普遍對資料庫的安全性、可靠性、穩定性有著全行業最為嚴苛的要求,因此,滿足金融行業需求的金融級資料庫產品幾乎成為所有行業中的標杆。報告認為,金融級分散式資料庫是能夠滿足金融級要求的高可用、高效能、低成本、線性水平擴充套件、企業級安全、便捷性運維的分散式資料庫。
在眾多金融級分散式資料庫中,按照資料處理方式,大致可以分成兩大類:聯機事務處理OLTP(On-line Transaction Processing)、聯機分析處理OLAP(On-line Analytical Processing)。OLTP是傳統的關係型資料庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。OLAP是資料倉儲系統的主要應用,支援複雜的分析操作,側重決策支援,並且提供直觀易懂的查詢結果。
可見,OLAP資料庫擁有高效能、可擴充套件、高可用和高容錯等特性,因此在金融行業的應用規模有了明顯的提升,並且正在從金融外圍系統向核心業務延伸,有力支撐著金融行業的數字化轉型。在過去幾年中,我國資料庫市場 “百花齊放”,包括傳統資料庫廠商,如達夢、人大金倉、神州通用;雲廠商,如阿里雲、騰訊雲、華為雲;新興資料庫廠商,如StarRocks、PingCAP、星環科技、OceanBase;ICT跨界廠商,如新華三、浪潮。這些廠商的資料庫產品和方案,正在各大商業銀行、金融機構及城商行的核心業務系統中投入使用並穩定執行,滿足了金融行業核心業務系統對資料庫的要求。
接下來我們來看兩個實際案例,希望能為更多金融行業使用者的轉型帶來借鑑和參考價值。
中原銀行和眾安保險邁入極速統一時代
中原銀行是河南省唯一一家分支機構網點覆蓋全省的省屬法人銀行,在全國城商行中的排名位列第 8 位,是河南首家資產超萬億的城商行。隨著業務不斷擴張、資料量的高速增長以及業務邏輯複雜程度的不斷提升,中原銀行需要快速響應客戶需求,為其提供更加精準的服務,同時藉助實時資料進行客戶洞察,幫助銀行業務人員做出業務決策,提高管理水平。
為此,中原銀行搭建了一站式商業智慧BI平臺,該平臺分為客戶行為分析系統知秋、一站式報表平臺魯班、一站式大屏平臺鴻圖和自助分析平臺雲間四大應用系統,總使用者超過一萬人。為支援BI平臺的快速高效工作,中原銀行搭建了完整的資料平臺。其中,該平臺的儲存計算層分為資料湖、離線數倉與實時數倉三部分,由實時數倉對實時資料進行處理,輔助進行實時決策。隨著使用者的增加,基於原有的資料平臺架構,僅能支援T+1小時級別的準實時報表,難以滿足銀行在客戶分析、風控管理等場景下的實時查詢與分析需求。此外,原有資料平臺流批鏈路複雜,運維成本高,且實時資料與離線資料的儲存並不統一,存在冗餘,造成存算資源的浪費。
為了提高資料平臺的查詢效率,深入挖掘實時資料的價值,提升實時響應能力,中原銀行調研了市面上兩款主流OLAP資料庫產品,發現ClickHouse在單表查詢和大寬表查詢表現優秀,查詢延遲也比較低,但是Join效能較差,且不易維護;StarRocks在固化查詢和靈活分析效能表現不錯,多表查詢效能也比較優秀,而且同時支援實時與離線匯入分析場景。與此同時,StarRocks具有流批一體、向量化執行、運維簡單、查詢效率高、相容性好且能夠滿足高併發查詢要求等六大優勢,恰好滿足了中原銀行構建極速統一的資料分析架構的業務需求。
(中原銀行基於StarRocks的實時數倉建設)
目前,中原銀行使用StarRocks完成了固定報表遷移、知秋系統改造與實時數倉建設,儘可能提高了銀行的資料匯入、查詢與分析效率。遷移完成後,固定報表查詢效率提升為原來的2.7倍,所需時間下降到3秒以內;原耗時排行top10的報表,查詢效率最佳化了10倍以上,同時還實現了自助客戶行為分析。更值得一提的是,實時數倉架構將中原銀行的離線資料和實時資料進行了統一,減少了資料的冗餘,同時支援秒級的匯入與查詢,提高了業務的時效性和多樣性。
目前,中原銀行使用StarRocks完成了固定報表遷移、知秋系統改造與實時數倉建設,提高了銀行的資料匯入、查詢與分析效率。遷移完成後,固定報表查詢效率提升為原來的2.7倍,所需時間下降到3秒以內;原耗時排行top10的報表,查詢效率最佳化了10倍以上,同時還實現了自助客戶行為分析。更值得一提的是,實時數倉架構將中原銀行的離線資料和實時資料進行了統一,減少了資料的冗餘,同時支援秒級的匯入與查詢,提高了業務的時效性和多樣性。
(中原銀行基於StarRocks的業務價值提升)
眾安保險是中國首家網際網路保險公司,不設任何分支機構,完全透過網際網路展業。截至2021年底,眾安保險服務超過5億使用者,累計出具約427億張保單。
眾安專注於應用新技術重塑保險價值鏈。在“保險+科技”雙輪驅動下,眾安將自身沉澱的保險科技能力和先進的商業模式向行業輸出,將資料作為支撐整體數字化路徑的基石,從看見到預見、從名單到客戶、從運營到創新,每一個環節和每一次升級都離不開資料賦能。
(眾安保險的數字化路徑)
在數字化轉型的程式中,多場景融合的精細化分析是數字化轉型破局的關鍵,但眾安遇到了一些困難,包括單一場景分析遭遇瓶頸、多場景資料分散嚴重和資料能力缺乏向業務層擴充。針對這些問題,眾安建立了“集智平臺”。目前在眾安保險內部各業務線和部門,超過3000人都在使用集智平臺,平均日活可達2000+。
集智上線後採⽤的是 ClickHouse,但隨著使⽤平臺的⽤戶⽇漸增多,業務⽅需要查詢的資料量也越來越⼤,業務場景變得複雜後,很多特定場景 ClickHouse 的表現都不夠理想:在多併發場景的查詢效能下降嚴重、多表關聯查詢效能⽋佳、排查運維成本較⾼、需要藉助第三方工具等。針對實時場景,集智平臺在使⽤ ClickHouse 的 Replacing 引擎中也遇到了查詢慢、不⽀持資料的刪除、只能對同一分⽚上同一分割槽的資料去重等痛點。
(眾安保險集智平臺介紹)
基於以上情況,集智平臺需要進行新的 OLAP 技術選型。經過選型評測發現,StarRocks支援高併發,部分場景可支援高達1萬以上的QPS,TP99可以控制在1秒以內。StarRocks透過CBO最佳化,可以自動選擇高效能的查詢計劃,多表關聯效能的表現也更好。
因此,眾安保險在集智平臺引入了 StarRocks,支撐理賠風險洞察、精細化運營分析、營銷實時效果追蹤等方面的應用,賦能戰略決策人員、財務企劃人員、營銷管理人員、資料運營人員、資料分析人員。為了提升集智在查詢載入方面的效能,同時將StarRocks極速查詢及高併發相關能力更好地賦能給業務,集智在產品側深度整合了StarRocks,使用者可以在平臺上快速完成一站式的統一實時看板搭建。
透過引入StarRocks,眾安保險集智平臺解決了極速查詢和高併發等資料問題,提升了集智平臺整體的資料支援能力和市場競爭力。以保險產品中線上渠道投放場景為例,當保險產品開始對外發售前後,市場人員會將產品投放到多個渠道進行推廣曝光,透過經營的核心報表實時核算每個渠道的投放成本以及其對應的ROI,根據資料表現情況實時調整投放策略,控制渠道營銷流程中的獲客單價和投放費用。因此資料反饋的快慢也會決定業務人員在定位問題、調整策略等事件上是否佔據最恰當時機。
透過中原銀行、眾安保險這兩個案例可以看到,作為新一代極速全場景MPP資料庫,StarRocks 具有可伸縮性、高可用、高效能、優秀的價效比等優勢,在提升企業的業務價值方面深具潛力。
極速統一3.0 助力資料要素價值充分釋放
大資料技術應用於企業級資料基礎設施已不鮮見,而金融行業在實踐層面一直走在行業前列,它們在資料湖、融合數倉等典型的技術場景不斷探索,逐步將先進的大資料生態技術應用到風險控制、運營管理、信貸查詢、信用卡徵信和財務分析等業務場景。
比如中國銀行就於2021年投產上線資料湖平臺,希望為中國銀行統一資料分析層、展現層、資料沙箱等探索提供平臺支撐,以及沉澱和深度挖掘全行資料資產。中國建設銀行則早早把資料倉儲和資料湖作為資料底座,不同於不少企業基於Hadoop體系的湖倉建設,透過一體化架構設計、一體化湖倉直訪、一體化資料檢視、一體化資產管理,形成了具有自身特色的湖倉技術體系。
透過對金融、遊戲、製造等行業的深入洞察和技術共創,過去一年, StarRocks 不斷打磨產品的功能、效能、穩定性,修改了 80 多萬行程式碼,釋出了近 50 個版本。而在今年 9 月的 StarRocks Summit Asia 2022 上,StarRocks 社群正式釋出了StarRocks 極速資料湖分析,開啟極速統一3.0時代。
(StarRocks 2.4 在 SSB單表、SSB多表、TPC-H三個標準測試集下,相比於去年同期,效能提升了50%-80%。在物化檢視、資源隔離、Query Cache、自動化資料分佈、匯入最佳化等各個核心功能均有重大突破)
StarRocks 認為,極速資料湖分析就是為使用者提供效能堪比資料倉儲的資料湖分析。在整個架構層面,當前StarRocks 的資料湖分析已經具備了存算分離、彈性伸縮的能力。在儲存層,資料支援按照Apache Hive、Apache Iceberg、Apache Hudi等主流表格式維護在物件儲存之上。在計算層,從查詢生命週期來說,StarRocks的無狀態計算節點compute node,已經可以負責從掃描到聚合的全部計算任務;在控制層,FE 統一接入各類主流資料湖的後設資料,並對湖上查詢請求進行統一排程和規劃。使用者透過StarRocks進行資料湖分析,一方面能夠享受存算分離、彈性伸縮等前沿技術帶來的降本增效,另一方面,無需資料匯入即可享受到堪比數倉分析的極速效能體驗,更加敏捷地從資料湖中獲取靈感和洞見,驅動業務增長。
人民銀行今年釋出的《金融科技發展規劃(2022-2025年)》中提出了八大重點任務,明確到2025年,金融科技整體水平與核心競爭力實現跨越式提升,資料要素價值充分釋放、數字化轉型高質量推進、金融科技治理體系日臻完善、關鍵核心技術應用更為深化、數字基礎設施建設更加先進。其中,資料庫一直是金融行業持續創新的重點領域,湧現出了大批的熱點技術和產品。而資料庫產品無論選擇哪條技術路線,目的都是要滿足高可用容災、資料一致性、業務連續性和系統可擴充套件等方面的要求。
面對金融級高要求,基於“極速統一”的資料分析新正規化打造出的MPP資料庫StarRocks,可以全面提升資料處理和分析的效能,將複雜分散的既有架構融合為簡單一致的嶄新架構。相信隨著金融行業數字化轉型的持續加速,StarRocks必將應對更多的複雜查詢、高併發、實時分析等場景,幫助使用者實現資料價值最大化。
來自 “ 廠商動態 ”, 原文作者:廠商動態;原文連結:廠商動態,如有侵權,請聯絡管理員刪除。
相關文章
- 阿里雲“玩轉雲上 StarRocks3.0 湖倉分析”,開啟資料分析新正規化阿里S3
- 資料分析在金融行業中的應用行業
- 淺議個人資料開發利用新正規化
- 金融行業的大資料分析行業大資料
- 金融行業的BI應用分析行業
- 烽火十八臺丨RayPORT賦能金融行業監管統計資料分析應用實踐行業
- 區塊鏈金融風控系統執行規則分析及開發案例分析區塊鏈
- 行業智慧化走向何方?昇騰AICE帶來的新正規化,新起點行業AI
- 淺析金融行業資料安全行業
- 設定以極速模式開啟網頁模式網頁
- 金融大資料行業應用及發展全洞察大資料行業
- 資料治理三大模式詳解,治理新正規化釋放資料潛能模式
- 金融行業“部落制”改革開啟敏捷轉型行業敏捷
- 金融行業關鍵業務資料庫系統加固方案行業資料庫
- 速看:大資料能在這幾個行業產生積極的影響!大資料行業
- DM資料庫金融行業案例(水貼一波)資料庫行業
- 資料標籤與指標在金融行業的應用指標行業
- 阿里雲丁宇:雲原生啟用應用構建新正規化,Serverless奇點已來阿里Server
- 中臺+低程式碼 企業數字化轉型新正規化
- 淺析分散式資料庫的技術框架及其在金融行業中的應用規劃分散式資料庫框架行業
- 技術內幕 | 阿里雲EMR StarRocks 極速資料湖分析阿里
- 一個金融行業站SEO最佳化方案行業
- 極速匯入elasticsearch測試資料Elasticsearch
- 資料不出本地,還能享受大資料訓練模型,聯邦學習提供一種應用廣闊的學習新正規化大資料模型聯邦學習
- 阿里雲丁宇:以領先的雲原生技術,啟用應用構建新正規化阿里
- 用 Python 進行資料分析 pandas (一)Python
- 金融案例:統一查詢方案助力資料治理與分析應用更高效、更安全
- 金融欺詐資料分析
- 如何啟用ADSL資料分包功能提升網速
- 巧用parallel極速提升資料載入速度Parallel
- 解析金融行業資料庫自主創新路徑行業資料庫
- 長文字殺不死RAG:SQL+向量驅動大模型和大資料新正規化,MyScale AI資料庫正式開源SQL大模型大資料AI資料庫
- windows10系統中360極速瀏覽器如何開啟隱私模式Windows瀏覽器模式
- 這款軟體提供極速企業資料傳輸解決方案!
- Win10一週年更新正式版怎麼啟用 Win10一週年更新正式版啟用教程Win10
- 大資料時代下,金融行業資料安全防護如何落地?大資料行業
- 指標+AI+BI:構建資料分析新正規化丨2024袋鼠雲秋季釋出會回顧指標AI
- 10分鐘極速入門dash應用開發