農行網路流量回溯與分析實現新突破
隨著數字經濟在中國經濟佔比接近四成,數字化已經成為了所有金融機構的必修課。2022年1月,國務院印發《“十四五”數字經濟發展規劃》,圍繞數字經濟發展,部署了最佳化升級數字基礎設施、充分發揮資料要素作用、大力推進產業數字化轉型、加快推動數字產業化等核心任務,並對金融業提出了加快數字化轉型的發展要求。
同月,央行印發《金融科技發展規劃(2022—2025年)》,提出搭建便捷易用的中臺、啟用資料價值、加快企業資料資產化、釋放資料要素潛能、提升數智化營銷能力等重點任務;銀保監會出臺《關於銀行業保險業數字化轉型的指導意見》,更是明確提出全面提升資料治理、資料服務能力、實時化資料應用等資料架構新要求。數字化時代的資料需求從“低頻、靜態的管理決策支援”向“高頻、動態的日常業務經營和資料價值消費”轉變。
一、資料倉儲在金融行業的發展歷程
隨著關係模型在資料庫領域的成功,Oracle、DB2、SyBase、Informix等資料庫產品湧現出來。很長一段時間內,這些產品非常好地滿足了企業對於資料儲存、資料計算的需求。但是,隨著資料量越來越大,應用場景越來越複雜,類似Teradata等公司開始在面向分析的應用場景上做出新的探索。1991年Bill Inmon出版《Building the Data Warehouse》一書,書中正式提出了資料倉儲的概念。資料倉儲誕生之後,逐漸面臨資料爆炸、運維管理複雜、成本高昂等問題,雲端計算時代又給資料倉儲雲原生化帶來了新的契機,透過大幅降低運維難度和成本,提升擴充套件能力和易用性,雲原生資料倉儲成為各領域構建數倉的首選。
金融企業往往同時經營著多個業務線,各個業務線獨立建設自己的業務流程支撐系統,以實現業務操作的線上化和資訊化。這種“煙囪式”的系統建設方式,會造成資料不一致、口徑不統一等問題,對金融企業的資料使用和決策支撐帶來困擾。金融行業的數字化轉型成為必然趨勢,要求行業必須具備敏捷創新能力,快速響應使用者需求,實現面向新業務的轉型。資料倉儲技術的發展,為金融行業構建企業級資料平臺提供了良好的方法論和技術支援,對金融企業提高商業競爭力至關重要。
資料倉儲在金融行業經歷瞭如下 幾個發展階段:
圖1 資料倉儲在金融行業的發展階段
(1)報告型資料倉儲階段。資料倉儲整合各業務系統的資料,以各種報表的形式呈現出來,供各級管理者瀏覽使用,管理者透過報表瞭解目前的業務發生情況。(2)分析型資料倉儲階段。管理者更希望瞭解現實情況產生的原因。需從不同角度對資料進行分析,需大量使用資料分析、資料探勘等技術,向資料提出問題,從資料當中獲取“知識”。(3)實時服務型資料倉儲階段。管理者希望進一步實時整合資料,實時獲取分析服務,實時預測未來的業務發展和可能風險,以提前做出業務響應和決策。依賴資料和演算法,管理者從被動管理逐步轉向為主動管理的決策狀態。
二、傳統數倉面臨的問題及新一代數倉的新要求
根據IDC預測,到2023年,中國的資料量將達到40ZB。資料倉儲作為資料密集、計算密集的資料集中處理平臺,是資料承載、數字化轉型不可或缺的一環。長期以來,國外資料倉儲廠商是金融、運營商等重點行業的普遍選擇。傳統資料倉儲面對數字化轉型新的訴求顯得越來越“力不從心”,主要體現在:自主可控能力不足;一體機擴容成本高、相容差;缺乏智慧化工具、建設週期長;實時分析和響應能力不足。隨著各行業數字化轉型的深入推進以及IT系統自主可控的政策性鼓勵,傳統數倉迎來了轉型升級的重要視窗期。
圖2 新一代資料倉儲的發展要求
新的數字化轉型和資料應用服務下,金融行業必須思考新一代資料倉儲的建設和解決方案。《金融科技發展規劃(2022—2025年)》和《關於銀行業保險業數字化轉型的指導意見》對新一代資料倉儲提出了新要求。
(1)中臺化:構建整合資料整合、提純加工、建模分析、質量管控、可視互動等功能的綜合型資料中臺,打造資料驅動、業務聯動的企業級資料服務能力中樞,推動業務資料化向資料業務化進階發展。
(2)數智化:在獲客、活客方面,盤活金融機構內部資料資產,洞察客戶行為偏好和真實金融需求,向客戶提供智慧化、人性化的營銷內容、產品選項、搜尋結果等。
(3)安全化:建立完善資料安全管理體系,建立資料分級分類管理制度。強化對資料的安全訪問控制,建立資料全生命週期的安全閉環管理機制。
(4)統一化管控與差異化服務的平衡:新一代資料架構既要兼顧對資料的研發、管理、模型、標準、治理等資料架構管理的統一化要求,又要滿足業務對資料實時化、低門檻資料服務、資料沙箱安全隔離、雲原生等靈活性和差異化業務需求。
圖3 傳統數倉到新一代數倉的多元化能力對比
數字化時代,作為企業資料架構的核心“資料動能引擎”,新一代數倉除了實時化、服務化的基礎能力外,需要具備更加多元化資料處理技術和主流技術架構融合。
為了解決上述問題和需求,阿里巴巴立項研發了一套高效能、敏捷可控、獨立智慧財產權的雲原生資料倉儲AnalyticDB。AnalyticDB在關鍵技術上持續創新,解決了傳統資料倉儲在大規模資料複雜分析場景下存在的效能、併發和智慧化瓶頸,在支援複雜查詢的分散式儲存引擎、超大規模混合負載的執行框架等方面取得重大突破。AnalyticDB的使用者覆蓋包括傳統大中型企業、政府機構、金融機構、網際網路在內的十餘個行業,並獲得了浙江省科技進步一等獎。
三、新一代雲原生資料倉儲的關鍵技術能力
下面將結合AnalyticDB,介紹新一代雲原生資料倉儲需具備的能力。
1.ACID+CRUD。由於金融行業對資料的準確性、可靠性的嚴苛要求,以及資料規模的極速擴張,傳統資料倉儲一方面透過MPP架構提升整體系統的吞吐,另一方面在分散式場景下也繼承了傳統關聯式資料庫ACID的特性確保了資料的準確可靠,ACID+CRUD這些基本特性是傳統資料倉儲的優勢,也是新一代資料倉儲應該繼續保留和發揚的。AnalyticDB保證完整的ACID事務能力,支援併發Insert/Update/Delete/Select,能夠支撐真實複雜的金融業務場景,滿足金融業務需求。
2.HTAP。HTAP資料庫是能夠將事務處理(OLTP)和資料分析(OLAP)請求在同一個資料庫系統中完成。分析師認為,這種架構具有顯而易見的優勢,不但避免了繁瑣且昂貴的ETL操作,而且可以更快地對最新資料進行分析,這種快速分析資料的能力將成為未來企業的核心競爭力之一。
AnalyticDB以OLAP為基礎,不斷最佳化OLTP的處理能力。在某交易所新版實時監查系統中,既有按證券代號、股東程式碼精確查詢,也有市場級別的拉抬打壓的分析,透過AnalyticDB提供的高效資源隔離能力,既保證了資料百萬級別的實時高效寫入,也保證了複雜分析的秒級返回,為科技監管提供了有效的技術支撐。
3.架構平滑演進。架構平滑演進是指企業能夠根據資料業務場景的特點,對擴充套件性、可用性、成本、效能等多方面綜合考慮去選擇最適合的一種底層資料平臺架構,並具備向另一種架構的平滑演進能力。隨著數倉叢集規模增長到一定程度(>200臺),存算一體架構遇到越來越大的問題,比如叢集規模無法進一步的擴大、資料無法共享、硬體故障導致的效能下降等。得益於40Gb網路、NVMe SSD、RDMA、CIPU(硬體輔助加速)等技術的普及和推廣,新一代資料倉儲架構得以升級和更新。
AnalyticDB實現了真正的存算分離,一方面透過計算和儲存分離做到資源池化實現資源最大化利用,另一方面透過低成本的物件儲存進一步減少成本,並具備快速橫向擴充套件的能力。
圖4 新一代數倉的存算分離架構
4.自主、安全、敏捷。《關於銀行業保險業數字化轉型的指導意見》將自主可控提至全新高度,自主案例是金融行業數字化轉型的核心關注點,要求堅持關鍵技術自主可控原則,對業務經營發展有重大影響的關鍵平臺、關鍵元件以及關鍵資訊基礎設施要形成自主研發能力,降低外部依賴、避免單一依賴。加快資料庫、中介軟體等通用軟體技術服務能力建設,支援大規模企業級技術應用。
AnalyticDB可實現對MySQL、Oracle、Teradata等的替代,支援主流CPU等自主可控的硬體平臺和OS部署,滿足部署需求。AnalyticDB程式碼均由團隊自主研發並掌握底層核心架構,行級程式碼自研率達到86.13%,完全具備程式碼的自主修改和調整能力。
四、新一代雲原生資料倉儲的實踐
出於服務國家“十四五”數字化轉型和基礎軟體部署戰略,阿里雲重磅推出“資料倉儲升艙解決方案”,將阿里標準化產品、多年實踐、成熟方法論結合,旨在解決傳統資料倉儲升級轉型面臨的諸多新變化,為行業客戶提供全新的數倉應用體驗,從以往高度限制業務發展的老技術架構,升級為雲原生技術架構,加速資料價值線上化。
透過阿里雲“升艙”體系化的指導方法論和配套實踐路線,幫助金融行業客戶將傳統數倉全面升級至AnalyticDB,或構建於AnalyticDB基礎上的資料平臺全新架構,有效滿足客戶對於資料平臺實時化、彈性擴充套件、高價效比及安全可控的訴求,突破傳統數倉技術瓶頸,賦能企業數智化創新。
圖5 新一代數倉AnalyticDB應用實踐
目前,AnalyticDB在金融行業中已經有諸多實踐落地,如申萬宏源證券、中再集團、太平洋保險等,在實時監察、實時推薦、數字營銷、千人千面個性化服務、實時賬單服務等領域實踐,幫助證券、保險、銀行打造一體的雲原生資料倉儲服務,從點到面逐步提升金融機構資料能力。
來自 “ 金融電子化 ”, 原文作者:金融電子化;原文連結:https://baijiahao.baidu.com/s?id=1746193827555431096&wfr=spider&for=pc,如有侵權,請聯絡管理員刪除。
相關文章
- 網路效能監控與流量回溯分析 - 輕鬆診斷網路問題
- 容器網路流量轉發分析
- 掌握業務效能監控與流量回溯分析的關鍵方法
- 用 HAProxy 實現網路流量的負 載 平 衡
- 網路分流器-網路分流器TAP網路流量分析
- 資料探勘與分析(網際網路行業)行業
- 數證杯2024-網路流量分析
- 如何準確有效偵測、分析網路流量
- 【網路安全】PostMessage:分析JS實現XSSJS
- 社會網路分析及其Python實現Python
- 騰訊徐春明:網際網路金融行業HBase實踐與創新行業
- 中國國際電子商務中心:2017年全國農村實現網路零售額突破萬億元
- 程式設計師如何實現“網際網路+”07-如何提高網站流量程式設計師網站
- 網路流量模型模型
- 樂維網管平臺(八):深度解析網路流量分析
- 新榜&國信證券:網際網路私域流量行業研究報告(附下載)行業
- 網路流量預測入門(三)之LSTM預測網路流量
- Mininet主機與真實網路互通方案實現
- 多網路卡環境下利用策略路由實現網路流量同進同出[轉載]路由
- 實時監控網路流量,精準辨別網路效能瓶頸
- 北京智和信通網路流量監控分析平臺
- Counter:簡單而免費的網路流量分析工具
- Cable:360實現的新虛擬網路架構架構
- iftop--實時網路介面流量監控工具
- 在Linux中,如何實時監控網路流量?Linux
- 網際網路揭祕:AI 的神話與現實AI
- 網路卡流量監控指令碼,python實現指令碼Python
- 使用Istio服務網格實現流量映象
- 億級流量實驗平臺設計與實現
- 產業網際網路賦能建築建材行業,實現合作共贏新經濟產業行業
- 業界新突破 | 揭示自動化篩選關鍵告警實現路徑之一
- 高效構建vivo企業級網路流量分析系統
- 新品釋出|綠盟網路流量分析治理平臺MagicFlow
- 社交網路分析的 R 基礎:(四)迴圈與並行並行
- SEO分析與關鍵詞優化到網站流量提升優化網站
- 如何使用大模型實現突破性創新研究?大模型
- 流量回放系統的設計與實現--流量錄製模組
- Virtualbox 虛擬機器實現與本地、網際網路互通虛擬機