華為AIOps使能服務加速新基建運維智慧化轉型

陶然陶然發表於2020-09-27

  人工智慧經歷了六十多年的浮浮沉沉,隨著計算算力的進步,演算法的創新和網際網路發展下的海量資料積累,人工智慧技術未來十年將煥發出新的活力,成為最具有衝擊力的科技發展趨勢之一。

  電信網路作為資訊通訊的基礎設施,具有應用人工智慧技術的巨大空間和潛力。如何利用人工智慧演算法提供的強大分析、判斷、預測等能力,賦能網元、網路和業務系統,並將其與電信網路的規劃、建設、維護、執行和最佳化等工作內容結合起來,成為電信業關注的重要課題。

  在HUAWEI CONNECT 2020期間,華為基於對電信領域的深刻理解和多年經驗沉澱,帶來了《AIOps使能服務》的分享,旨在結合電信領域應用場景,使能網路達到自動、自愈、自優和自治的自動駕駛網路,提升整個網路的效率,降低OPEX。

   AIOps成為電信網路運維智慧化轉型趨勢

  隨著“5G 新基建”的加速實施,數字經濟發展迎來新的動能。不僅推動投資消費的快速成長,還將驅動各行業的數字化轉型升級。隨之而來的是網路問題複雜化與業務質量高要求的挑戰,運維能力的演進成為電信網路能否持續發揮效能的關鍵因素。

  電信網路運維作業正面臨問題發現被動(75% 問題由使用者發現),故障根因定位難(90% 時間用於問題定位)的業務挑戰。同時,各專業運維支撐系統功能也面臨開發週期長,閉環流程自動化程度低的技術瓶頸。因此,運營商期望引入AI實現智慧運維,做到主動維護和故障自愈。

  在運維支撐系統的演進方向上,AIOps(運用AI及大資料技術解決運維問題)已經成為電信行業運維智慧化轉型的趨勢和共識:構建AIOps平臺能力,支撐不同運維場景應用。在未來五年內,電信行業市場的運維繫統和平臺將加速AI能力的升級,成為電信領域AI應用的核心場景,投資佔比達到60%。

  因此,AIOps已經成為電信網路運維智慧化轉型趨勢。透過構建電信領域AIOps平臺能力,快速實現智慧運維升級。

   華為AIOps助力網路提升可靠性及使能智慧化運維

  按照自動駕駛網路的等級定義,運維的智慧化目標是要實現全域、全流程的預測性運維,自動監控、定位、自愈。

  華為AIOps使能服務作為自動駕駛網路AI引擎NAIE的核心能力,基於AI平臺,提供了一系列的電信領域AIOps原子能力以及組合編排能力,使能網路管控析單元、智慧運維解決方案等運維繫統,最終幫助運營商打破原有的煙囪式建設方式,將各專業運維繫統的應用與AI能力解耦,採用分層的服務化架構對接共享資料中心,集中提供AIOps能力,適配運維場景應用百花齊放的需求。

  如下是華為AIOps使能服務預組合編排好的服務,可開箱即用:

   kpi異常檢測服務,快速智慧識別海量kpi/kqi的異常情況,廣泛應用在網路效能和質量監控場景;

   故障識別與根因定位服務,根據海量告警結合對應網路拓撲和傳播知識,實時識別故障及根因網元及告警,可自動學習知識規律,保證持續最佳化,可廣泛應用在各種網路場景;

   日誌異常檢測服務,實現日誌的自動分類和統計規律發掘,實時監控出系統的異常行為和相關日誌,可廣泛應用在IT及電信網路場景;

   硬碟異常預測,可智慧預測短期內(14天)的硬碟故障,以採取規避預防措施,以免對業務產生影響,廣泛支援主流廠商的HDD及SSD型號。

   細數華為AIOps使能服務四大核心競爭力

   提供豐富的AIOps原子能力:AIOps的原子能力覆蓋運維全流程,包括預測、檢測,定位、執行。原子能力庫支援流量預測,故障預測,KPI異常檢測,日誌異常檢測,CHR異常檢測,異常關聯分析,事件聚合,根因定位等20+原子能力。

  作為電信領域的AIOps使能服務,具備兩個核心特點:一是基於華為電信領域的經驗,原子能力將AI演算法與電信領域行業知識融合,預製了預設的電信領域模型引數,同時支援現網執行態的調優,解決當前通用演算法模型在具體行業落地效果差的難題。目前,已經在現網得到了規模驗證。

  另一個是AIOps原子能力採用標準化模型規範,統一資料輸入,引數配置,結果輸出等介面。為AIOps單點原子能力到靈活的組合串接提供了基礎。

   組合編排與DevOps能力:透過組合編排功能,使用者可選擇業務場景所需的AIOps原子能力,透過視覺化方式完成流程串接,並進行業務泛化引數配置,包括資料接入方式,模型引數,內建電信領域泛化引數,事件通知方式、視覺化Dashboard等配置。上述能力支援視覺化編排或介面呼叫方式實現。此外,基於NAIE平臺訓練服務,AIOps的原子能力庫支援使用者根據實際業務需求開展演算法模型的創新與開發,不斷擴充套件AIOps能力。NAIE的生態服務也提供專業的人員培訓賦能。

   支援電信領域資料對接:支援KPI、告警、日誌、xDR等電信領域主流運維資料。支援Kafka,資料庫,檔案系統,Restful等電信運維繫統的主流資料對接方式。AIOps使能服務提供通用的資料來源對接和標準化資料治理元件,透過配置項快速建立與運維繫統的資料來源連線,透過SDK將不同的資料型別和格式治理成標準化的AIOps原子能力輸入集,用於模型訓練和推理。

   場景組合服務:圍繞運維全流程(發現、分析、處理)提供預製典型場景組合應用,快速接入運維流程。

  綜上所述,華為AIOps使能服務作為智慧運維AI能力引擎,融合AI的技術優勢與華為在電信領域的專業優勢,為運維繫統的智慧化演進提供AIOps平臺能力支援,助力到各專業運維繫統的應用快速上線,讓運維專家專注場景應用設計和業務目標達成。

   華為AIOps助力運營商及企業網路打造最佳實踐

  在KPI異常檢測方面,電信網路中,透過KPI來預測和檢測網路問題是最普遍的場景。透過AI演算法基於歷史資料自動生成每個KPI的動態門限,避免傳統靜態門限帶來的誤報和漏報。

  華為NAIE融合了電信領域的運維業務特點,提供單指標/多指標檢測,異常原因關聯分析,模型的自學習調優等關鍵能力。目前已經用在核心網,無線,數通等不同業務領域。國內某運營商採用了核心網KPI異常檢測服務以後,實現提前5小時識別異常並主動預警,降低了業務損失。

  在告警根因定位方面,發現異常或者故障之後的定位是運維流程中的難點,如何準確的將多維度的異常、告警等事件進行匯聚,減少故障噪聲,準確定位到具體原因?這些工作目前主要依賴專家經驗或者手工分析,而且受限於分析算力和知識資訊,效果並不好。

  華為NAIE AIOps透過AI演算法與業務的融合,支援多類異常/告警等事件的智慧故障定位,自動實現時間,拓撲和故障傳播圖等維度的事件匯聚和根因定位。目前已經應用到無線接入網等業務領域,經過實際驗證,無效上站減少60%,根因識別準確率85%+,運維效率整體提升15%。

  寫在最後,電信領域AIOps落地的關鍵是需要將行業知識與AI技術融合。網路運維繫統的AIOps能力構建的趨勢是業務與能力解耦,做到AIOps能力的複用、拉通,支援,適配運維場景應用百花齊放和快速上線迭代的需求。

  因此,AIOps使能服務作為智慧運維AI能力引擎,融合AI的技術優勢與華為在電信領域的專業優勢,為運維繫統的智慧化演進提供AIOps平臺能力支援,助力到各專業運維繫統的應用快速上線,讓運維專家專注場景應用設計和業務目標達成。目前,華為AIOps使能服務已經在無線,核心網,數通等網路域得到了廣泛的應用。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28285180/viewspace-2724635/,如需轉載,請註明出處,否則將追究法律責任。

相關文章