應對複雜架構下的監控挑戰?統一運維可觀測能力是關鍵!

袋鼠云数栈發表於2024-10-22

在全球數字化變革背景下,企業需適應數字經濟與市場變化,進行系統性數字化轉型。在“十四五”規劃指導下,企業紛紛探求數字化應用之路,大資料、雲端計算、人工智慧、區塊鏈等技術成了熱門話題,其中雲運維備受矚目。

企業在數字化轉型中難免會碰到雲上系統規劃、運維體系建設、雲上安全等挑戰,因此用可觀測性來改進現有監控系統已是大勢所趨。可觀測性是指透過系統外部輸出推斷內部健康狀態,在複雜場景下是安全生產的必要手段。建設可觀測性平臺可提高故障響應速度,降低排查成本,增強系統穩定性。

因此,需要建設統一運維可觀測的資料化運維平臺,以滿足資料統一採集、統一處理為基礎、以智慧演算法、全鏈路分析為導的需求,打造全棧統一的可觀測平臺,實現系統執行深度感知,故障及時發現、快速恢復,保障企業業務穩定高效執行。其核心功能應該要包括以下6個部分:

一、端到端全鏈路監控

為了更完整、更有邏輯性地展示應用元件之間的關係,並快速反應出元件健康情況,雲掣的統一運維觀測套件從 web 網站前端 API 請求到後端應用呼叫鏈進行關聯查詢,包括關係型資料和非關聯式資料庫的呼叫分析、應用效能統計指標異常和錯誤分析等,從而構建出端到端的全鏈路監控能力。示意圖如下:
file

二、全息業務監控
全息業務監控可透過對應用進行業務及架構打標,實現服務業務應用架構視覺化,展示業務系統間呼叫關係、各個業務間請求量、呼叫次數、各業務提供的介面數量,結合以上資訊可核算各業務服務價值,分析業務中臺業務效能,兼具架構感知能力。作為業務中臺能力中心的總控入口,全息業務監控可檢視業務中心詳情,包括監控告警、能力描述、出參、入參等資訊;同時可作為服務能力管控入口,實現監、管、控一體。
file

在業務分層架構圖中展示出業務模組之間的呼叫關係和實時標識異常服務,並支援下鑽,可以快速進行根因定位。
file
file

三、應用監控

產品支援應用監控,能追蹤每一個請求在各個應用元件中的路徑,還具有自動發現應用拓撲、自動發現並監控介面、異常捕獲分析、多維排查與分析和線上診斷功能。
file
應用總覽模組可檢視應用整體狀態服務呼叫棧中可發現異常介面。
file

四、資源監控

產品支援硬體裝置監控(伺服器/安全裝置/儲存裝置)、網路裝置監控(交換機/路由器)、主機監控(作業系統/程序)、容器監控、資料庫監控、中介軟體監控。
file

五、前端監控

產品支援監測使用者在不同終端上瀏覽 Web、H5、微信小程式或支付寶小程式的過程中的使用者體驗效能指標,無需埋點,支援多種接入方式靈活接入,實現端到端的效能分析。支援頁面、介面、瀏覽器、作業系統、裝置、運營商、網路、地區等多個維度對網頁效能進行分析。
file

六、智慧告警

產品支援快速接入各類告警資訊,透過自動去重、規則壓縮、透過智慧演算法減少告警噪音,避免告警風暴。透過配置分派、排班、通知策略等功能,快速實現告警流程化管理,幫助運維團隊更快響應告警,恢復告警,提升告警管理能力。
file
據IDC預測,2020至2025年中國第三方雲運維服務將保持40.6%的複合增長率,2025年市場規模達37.4億美元。服務範圍從託管擴充套件到遷移、諮詢、安全及最佳化,雲原生與AIOPS技術日益重要,想要在時代的巨浪中平穩航行,廠商必須把握統一運維可觀測能力。

雲掣深耕可觀測運維多年,結合自身經驗,聯合行業專家編寫推出《雲運維服務白皮書》。白皮書總結了企業用雲面臨的多方面挑戰,提出了雲運維服務公司需要具備的技術能力、提升運維效率所需的相關產品和工具等,介紹了多個行業的企業數字化轉型和應用案例,力求幫助企業更好地利用雲端計算的優勢,更快實現數字化轉型。

《行業指標體系白皮書》下載地址:https://www.dtstack.com/resources/1057?src=szsm

《數棧產品白皮書》下載地址:https://www.dtstack.com/resources/1004?src=szsm

《資料治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=szsm

想了解或諮詢更多有關大資料產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky

相關文章