智慧運維的進擊:從邊緣走向中心

Linksla發表於2022-05-27

一直以來,由於運維不是生產力部門,之前並未受到重視,有的企業甚至沒有專職的運維崗位,大家對運維的認知可能是“網管”,修電腦的。並且由於缺乏運維工具和操作指南,早期運維工作只能由運維人員手工開展,依靠多名運維人員共同完成產品執行狀態、產品效能指標、產品上線與變更服務等的監控。

隨著全球數字化程式的推進,伺服器、軟體模組、訪問資料激增,IT系統的數量和複雜程度加劇,古早的運維方式難以承受巨大的運維壓力,監控專案過多導致無瑕應對,事故發生無法準確定位,迫切要求運維工作向自動化、智慧化轉變。

智慧運維AIOps由此興起,以大資料和人工智慧的方式,替代人工對資料中心的運維方式。運維經歷自動化、運維開發一體化的發展演進,但依舊很依賴人工操作,依賴運維人員的技術、經驗才能完成自動化運維。

而智慧運維很重要的一個突破,就是進行自學習的“去規則化”改造,機器學習演算法自動地從海量運維資料(包括事件處理日誌)中不斷地學習、提煉並總結規則,將人工總結的經驗變為自動學習的結果,緩解運維工作壓力的同時,極大提升運維工作的效率和質量。

在日常系統運維中,常見的兩個場景:異常檢測和預警。傳統運維往往會出現告警不準確、問題難定位、根因難確定等狀況,智慧運維的落地,則會主動、迅速、準確地發現和定位問題。 此外,智慧運維在質量保障(包括異常檢測、故障診斷、故障預測、故障自愈等)、成本管理(包括指標監控、異常檢測、資源最佳化、容量規劃、效能最佳化等)和效率提升(包括智慧變更、聊天機器人)等場景中為企業全方面保駕護航,除了安全保障,智慧運維將在業務中發揮更多的資料價值,為企業發展提供決策依據。

LinkSLA提供使用者價值

1、全棧監控,主動式問題處理

LinkSLA智慧運維管家透過統一部署實現資料中心一體化監控和智慧化運維,將所有的監控資源和物件統一採集,建立底層基礎架構到上層業務應用的關聯關係,當裝置發生故障時,快速定位問題,分析裝置對業務系統造成的影響,有效降低故障風險,大大提高運維效率。

2、AI機器學習,異常監測提前預警

AI機器學習圍繞業務指標及資料規律,自動調整閾值,無需人工手動調整。減少大量的誤報、漏報、重複報,實現異常監測,告警降噪,避免傳統工具帶來的告警風暴,整合告警事件工單,讓故障得到快速響應。

3、MOC值守,專家團隊護航。

平臺主動監控,Moc實時響應。強大後臺支撐平臺與專家團隊,解決客戶運維能力不足,新技術上線困難等問題;可遠端申請MOC工程師協助,迅速定位故障,實現高效遠端協作指導。資深產品專家和客戶關懷工程師7×24小時受理客戶問題。

4、共享知識庫

LinkSLA共享技術乾貨包,運維經驗以案例方式分享;完善知識庫體系,提供新人技能培訓,實現技術知識分享最大化。及時更新行業經驗,各種專業類運維報告。

5、支援移動應用

整合微信、郵件訊息引擎,及時接收告警資訊。


智慧運維的適用領域廣闊,除了網際網路,在金融、物聯網、醫療、通訊、工業等領域均表現出對智慧運維的強烈需求。 例如,冬奧會、冬殘奧會主火炬氫能保供任務的高溫油泵突發異常,裝置監測系統觸發報警後,5分鐘內迅速排除隱患,就是得益於智慧運維繫統的應用。

在數字經濟發展的大背景下,機器學習和人工智慧為智慧運維提供技術支撐,而云計算特別是公有云的發展,改變了過去資料中心小而分散的局面,能為人工智慧分析提供全量、全面的大資料,智慧運維將進入快速發展時期。

儘管只是網際網路經濟的一個細分賽道,但智慧運維已經成為資本爭奪的新風口,智慧運維未來發展表現出強勁的韌性。 政府部門也陸續《推動企業上雲實施指南(2018-2020年)》《國家新一代人工智慧標準體系建設指南》等一系列政策推動智慧運維的發展。

目前,中國的IT運維服務商主要由原廠運維服務商、第三方運維服務商、ITOM/ITOA廠商和IT基礎架構系統整合商組成,正在朝著高效、專業的方向演變。 但也需承認的是,我國智慧運維還處在起步階段,未來還有廣闊的發展空間。

挑戰在於智慧運維需要高質量地標註資料,高效的資料標註方案才能減少人力、時間等成本的消耗,事半功倍。其次,線上系統本身具有規模性和複雜性,是需要長期投入的研究領域,未來任重道遠。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70013542/viewspace-2897519/,如需轉載,請註明出處,否則將追究法律責任。

相關文章