螞蟻集團TRaaS入選中國信通院《資訊系統穩定性保障能力建設指南》最佳實踐案例
近日,中國資訊通訊研究院分散式系統穩定性實驗室正式釋出了《資訊系統穩定性保障能力建設指南》(以下簡稱《指南》)。螞蟻集團應邀深度參與了《指南》的研討編制,該指南收錄了包括螞蟻集團在內的多家知名機構在系統穩定性保障服務方面的優秀案例,旨在為各行業提升系統穩定效能力提供參考。
隨著各領域數字化轉型的推進,資訊系統的應用範圍不斷擴大、承載業務愈發關鍵,使用者的高頻訪問成為常態。面對使用需求的不斷增長,大多數資訊系統透過分散式架構改造、DevOps體系建設、大量引入開源技術來不斷突破自身處理能力上限,這些措施引入導致了資訊系統架構複雜性呈指數上升,顯著增加了穩定性風險。與此同時,資訊系統的穩定性也受到國家高度重視,2021年釋出的 《關鍵資訊基礎設施安全保護條例》,就對我國關鍵資訊基礎設施的穩定性保障工作提出了明確要求。
在此背景下,《資訊系統穩定性保障能力建設指南》應運而生。作為國內首個全方位梳理總結穩定性保障相關實踐經驗、方法論的研究成果,指南梳理了新階段下資訊系統穩定性保障能力建設工作的相關背景、基本原則、關鍵要素、核心能力以及評價體系,探討了穩定性保障工作的未來發展趨勢。
《指南》認為,資訊系統是各行業的基礎設施,而網際網路技術的高速發展為系統穩定性帶來了諸多新挑戰,其中分散式系統面臨著更高的穩定性風險。為此,指南開創性地提出了數字化時代下的資訊系統穩定性保障體系,共包含“兩個總體原則、三個關鍵要素、四類核心能力、五項重要工作”。
不僅如此,為幫助各行業完善系統穩定性保障體系,《指南》徵集收錄了多個資訊系統穩定性最佳實踐案例,其中螞蟻集團穩定性保障體系被收錄在網際網路行業案例。
螞蟻集團主要以支付寶客戶端提供支付、理財、保險等業務,服務十億級使用者,業務場景複雜度高,同時涉及金融相關業務,因此對穩定性要求極高。伴隨著業務的多年發展,螞蟻集團逐漸建立穩定性保障方面的問題解決方案和風險防控體系TRaaS(Technological Risk-defense as a Service)。TRaaS關注整個研發運維過程可能產生的穩定性風險,從流程制度、文化宣導、技術方案、平臺體系多個方面提供穩定性風險防控方案,實現風險的主動發現和自我恢復能力,助力業務高質量增長。
簡單來說,TRaaS 是把支付寶整個分散式架構和技術風險能力組合在一起的免疫系統,將高可用和資金安全能力結合AIOps,使系統實現故障自愈。此外,TRaaS還具備以下六大特性:
- 統一變更管控,智慧變更風險防禦;
- 基於chatops的標準SOP故障管理,精細化應急定位輔助;
- 智慧資源容量排程,實現穩定性和成本最優平衡;
- 萬億級資金證賬實智慧實時核對;
- 大規模混沌工程驅動穩定性技術演進,技術風險文化宣導;
- AIOps在可控風險下提升運維效率;
事實上,TRaaS 誕生於螞蟻集團超大規模系統的實戰經驗之中,是在經歷了嚴酷的“雙十一”等千錘百煉的考驗下一步一步逐漸成長起來的技術風險防控平臺,保障了內部超大規模系統的穩定性。
螞蟻技術風險總架構李錚表示,過去十幾年,因為對系統穩定和安全的重視,螞蟻集團已經累計了無數的經驗和技術。TRaaS是螞蟻在內部大規模複雜業務中多年積累和打磨的技術風險平臺能力。未來,我們將逐步開放更多技術和產品,幫助各方構建穩定的數字化系統。
目前,螞蟻集團TRaaS技術風險防控平臺正透過商業化及開源專案等形式對外輸出,螞蟻希望將自身在技術風險防控中的平臺積累及實踐經驗分享給各行業的合作伙伴,讓夥伴們能通力合作、共享風險保障技術,一起為企業系統穩定性保駕護航。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69904796/viewspace-2886738/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 螞蟻集團TRaaS技術風險防控平臺入選中國信通院《資訊系統穩定性保障能力建設指南(1.0)》最佳實踐案例
- 助力軟體供應鏈安全 螞蟻集團多項產品入選信通院優秀案例
- 穩定性領導者!阿里雲獲得信通院多項系統穩定性最高階認證阿里
- 來自中國信通院的認可!美創政務資料安全治理實踐入選“星熠”案例
- 如何保障系統穩定性並實現綠色減排?螞蟻集團有這些關鍵技術
- 【穩定性】穩定性建設之依賴設計
- 有數BI大規模報告穩定性保障實踐
- 貨拉拉技術穩定性體系1.0建設實踐
- 資料安全能力獲認可!Smartbi入選中國信通院“卓信大資料計劃”大資料
- 案例分享:製造業網管系統建設最佳實踐
- 多利熊基於分散式架構實踐穩定性建設分散式架構
- 美創科技深度參編,中國信通院《資料安全治理實踐指南(2.0)》釋出
- 研發效能與穩定性保障
- 百度熱點大事件搜尋的穩定性保障實踐事件
- 多項功能實力過測|綠盟科技入選中國信通院資料安全類產品能力驗證名單
- 網易嚴選基於“服務畫像”的長效穩定效能力建設實踐
- Apache Flink 在小米的穩定性最佳化和實踐Apache
- 剖析多利熊業務如何基於分散式架構實踐穩定性建設分散式架構
- 高效能高併發系統的穩定性保障
- 大促穩定性保障深度覆盤,包含應對措施和案例分析
- 中國信通院:資料標準管理實踐白皮書(附下載)
- 中國信通院:資料資產運營能力成熟度模型模型
- 醫療資訊化建設實踐丨一體化安全能力建設,助力醫院安全能力提升
- 首批+唯一!阿里雲實時計算 Flink 版通過信通院大資料產品穩定性測試阿里大資料
- Filecoin激勵機制:通過Slashing保障網路穩定性
- 四個步驟,教你落地穩定性保障工作
- 大型微服務架構穩定性建設策略微服務架構
- 中國民航飛行學院人事薪資管理系統實踐案例
- RESTful API 設計指南——最佳實踐RESTAPI
- 數十萬QPS,百度熱點大事件搜尋的穩定性保障實踐事件
- Node.js 指南(ABI穩定性)Node.js
- 架構-穩定性建設邏輯問題實戰總結架構
- Python開發指南:最佳實踐精選Python
- 中國信通院:2023年人工智慧研發運營體系(MLOps)實踐指南(附下載)人工智慧
- 中國信通院:零信任產業圖譜產業
- 如何利用 “叢集流控” 保障微服務的穩定性?微服務
- 中國信通院:2022年數字孿生城市技術應用典型實踐案例彙編(附下載)
- 《江蘇聯通資料安全體系建設》入選“星河”優秀案例