智慧,服務,生態:華為調製的AIOps,味道有何不同?

naojiti發表於2021-09-29

追蹤AI技術這麼長時間,我們親眼見到了許許多多的職業,工作環境因AI而變得更好。

昔日在高空連續工作的吊車司機,變成了可以遠端操作的“空調哥”“空調姐”;曾經風裡來水裡去的巡檢工,工作強度因為智慧監控系統而輕鬆了不少……

然而,還有一種隱形的重複類工作很容易被忽視,那就是IT運維。

可能在很多人眼裡,運維人員只需要在系統當機、電腦壞了的時候擔任“救火隊員”即可。但隨著IT系統規模越來越大、網路複雜度越來越高,傳統的運維工作正在變成了高強度且枯燥的工種。運維人員在日常巡檢中需要重複上千次抄表,每天要面對並處理成百上千次告警通知……

據說每個運維人入職時的期待,就是喝著咖啡做運維,蹺著二郎腿就把工作做好了。然而年復一年,儘管運維輔助工具也在迭代,但始終趕不上數字化程式快、企業業務變化大,別說“咖啡運維”了,晚上能少收到幾個告警工單就謝天謝地了。那麼,AI能為他們帶來改變嗎?

剛剛過去的華為全聯接大會上,華為就為企業運維人斟上了一杯“咖啡”,釋出了AIOps服務。

AIOps(智慧運維)一直被看作是下一代運維模式,這杯由華為調製的運維“咖啡”,又是什麼味道的呢?

品味一番會發現,前調是智慧,與AI相結合的AIOps帶來了顛覆傳統運維的體驗;中調是場景,智慧技術與業務場景的有機結合,讓AIOps服務品起來更加和諧絲滑;後調是生態,要能相容各種網路協議、裝置,才能讓不同口味的運維人員都收穫驚喜。

透過這杯咖啡,我們來一起品一品數字時代的運維之變。

前調:氤氳智慧的香氣

我們都知道,AI尤其是機器學習演算法,非常適合處理重複性、預測型、大資料的工作,恰好指向了當前運維工作的核心挑戰:

1.ICT網路不斷迭代發展,系統日趨複雜,PB級海量資料成為常態,有的運營商甚至面臨2/3/4/5G四世同堂的網路局面,運維物件越來越多,運維人員不得不忙於應付大量告警和重複工作,而無法將時間放在運維策略建構等更有創造力和價值的工作上;

2.新服務、新技術帶來了更多的維護場景和要求,容器化、虛擬化、分散式服務、多雲管理等等,讓運維人員在故障定位、日常巡檢等工作中身心俱疲,面對問題時往往需要花費很長時間來決策,要保證系統的高可用、高可靠、高效率十分困難;

3.萬物互聯、千行百業的數字化升級,帶來了錯綜複雜的IT設施種類,從硬體到軟體如果沒有整合監控,運維工具各自孤立,缺少統一集中的監控管理機制,運維專家在統籌決策時也容易出現混淆,不得不處於時刻待命的“救火狀態”。

因此, Gartner在2016年提出的AIOps概念,即 Artificial Intelligence for IT Operations,倡導將人工智慧應用於運維領域。有以下好處:

第一,AI智慧體能夠從日常的運維大資料(日誌、監控資訊、應用資訊等)中總結規律,根據當前的環境自動分析;

第二,AI演算法會在特定場景下,第一時間發現指標異常,進行故障精準分析與定位,自動觸發修復機制,將故障進行恢復,減輕運維人員的工作負擔;

第三,故障修復之後可以自動覆盤並沉澱為知識資產,進一步最佳化迭代演算法,形成千人千面的智慧運維工具。

由此,也就真正能將運維人員從重複性工作中解脫出來,讓“咖啡運維”的夢想照進現實。

中調:深入場景的甘甜

聽起來,AIOps簡直是運維人員的明日之光。Gartner也曾預測,到2022年AIOps 的採用率將會達到 50%。然而現實中,落地速度卻並不像預期中那樣迅猛。是什麼讓運維人員“只聞其香,難嘗其味”?一個詞:開發。

AIOps離不開人工智慧兩大要素:資料與演算法。一般來說,支撐業務的AIOps工具,需要結合企業自身的運維框架、策略,投入運維大資料,進行針對性的模型開發和訓練,才能保證演算法的精準度。

但現實很骨感,企業中具備AI專業知識的綜合性運維人才十分稀缺,即便引進了相關人才,也需要花費大量時間來梳理多源異構的大資料,針對業務場景進行編碼開發,耗時不說,最終的模型效果還不一定理想,這些客觀問題都阻礙了AIOps在產業側的落地應用。

因此在華為全聯接大會上,華為正式釋出AIOps服務,聚焦網路智慧運維,降低AI開發門檻。此次釋出的AIOps服務有三個特點:

第一,紮根場景,適配需求。此次釋出的AIOps服務結合了華為30多年的網路運維和場景理解經驗,覆蓋MBB/FBB、園區網路、資料中心網路、IT應用四大領域,和故障預測、檢測、診斷、識別等環節,異常識別與故障診斷準確率達90%,能夠滿足絕大多數企業的日常運維需求;

第二,簡單易用,降低門檻。華為AIOps服務沉澱了10多個開箱即用的智慧APP模板,使用者只需配置資料來源,即可啟動APP執行,將AI應用的開發部署過程縮短到分鐘級;預整合了20多個高質量的AI原子能力,覆蓋預測、檢測、診斷、識別等網路運維場景,只需要簡單拖拽,系統就能自動完成節點間的資料銜接,自動推薦下個節點,不需要使用者從元件庫中反覆篩選驗證,大大降低了應用開發門檻。

第三,視覺化定製,提升效率。華為AIOps服務還提供了80多個2D/3D視覺化元件,開發人員很輕鬆就能DIY出一個包含趨勢、報表、網路關係等元素的視覺化大屏,讓業務結果直觀、快速地呈現出來,有效減少運維人員決策、處理的時間,並確保資產的整體管理和精細化運維,可以提升業務系統的SLA,為企業降本增效,讓運維資料這一重要資產發揮出更大的價值。

說了這麼多,大家一定很好奇:AIOps到底怎麼用?我們可以看一個真實的運維案例,瞭解AIOps服務如何給企業和使用者帶來價值。

試想一下,如果一個使用者剛剛辦理了尊貴的5G套餐,卻突然間上不了網,運營商會不會就此損失一個高階客戶?隨著核心網承載量越來越大,監控指標多,傳統靜態閾值檢測存在漏報誤報的問題,一旦出現故障沒有及時排除,對使用者體驗影響極大。

去年7月10日,某供應商將DNS指令碼的指向配置錯誤,影響了某運營商8個城市2000多5G使用者資料業務。幸好藉助華為核心網KPI異常檢測APP,提前5小時發現了問題,併傳送了告警簡訊,降低了業務損失,保證了5G高階使用者的網上衝浪體驗。

異常檢測精度高,故障定位回覆效率高,智慧運維應用適配業務場景,變被動響應為主動運維……這正是華為AIOps服務的價值所在。

後調:擴散生態的溫度

而更進一步,華為賦予了AIOps悠長的後調,即建構了值得長期品味的AI生態。

在本屆華為全聯接大會中,華為網路人工智慧產品部AI模型與訓練服務部部長王晶提到,“華為AIOps旨在降低ICT領域AI應用開發門檻,將AI技術帶入運維預測、檢測、診斷、識別、最佳化等每個環節,賦能合作伙伴創新,共同建設智慧運維生態,實現商業成功”。

這杯甄給運維人的“咖啡”,為什麼需要聚生態之力來打造?歸根結底源於華為對運維行業的深度把脈:唯有眾智共創,才能快速推動智慧運維AIOps時代的到來。

運維市場前景廣闊,根據艾瑞諮詢的預測,2021年中國IT服務有望突破萬億元大關,其中IT運維市場規模將達2941.2億元。這也就導致很多廠商看中了這塊“蛋糕”,紛紛進入,行業創新和實踐不斷湧現。但跨廠家主流裝置無法互通,多層次協同難以形成,最終影響的還是客戶體驗,從而延緩了智慧運維的落地部署。要解決這一問題,就需要以開放心態實現共享,以生態模式促進共同獲益,進而推動智慧運維進入良性發展階段。

所以我們注意到,華為AIOps服務另一個餘韻悠長的操作就是:開放。

首先,向跨廠裝潢置自開放。華為AIOps服務實現了主流裝置的自動對接,支援SFTP、Kafka、Rest等通用採集協議,支援華為30類網元、跨廠家100多種主流裝置的自動對接,可以滿足端管雲的資料採集需求;

其次,向企業人才、合作伙伴開放。華為自身技術資源向全球企業、運維開發工程師、合作伙伴開放,利用華為的技術、AI原子能力等,可以低門檻、零程式碼地開發更多運維應用,構建自身的運維服務能力,開發獨特的運維服務,生機勃勃的應用開發生態快速崛起,將為智慧運維的工具創新、能力擴充套件,打下堅實基礎。

今天,數字化轉型是中國經濟發展、產業升級的最強音,少了高質量、高效率的運維能力,數字化就猶如沙上聚塔,顯得尤為脆弱。從這個角度看,運維人員也早已不再是邊緣化的“救火隊員”,而是網路安全穩健執行、系統效能最最佳化、組織生產力最大化的“神助攻”。

而華為打造的智慧底座,正有力地託舉著運維人的智慧憧憬,讓他們終於能夠放心地飲下這杯香氣四溢的“咖啡”。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2794435/,如需轉載,請註明出處,否則將追究法律責任。

相關文章