透過視覺化運維配置,實現故障秒級自愈

北京智和信通發表於2022-12-31

急促的告警鈴聲響徹寂靜的夜晚。對運維人來說,晚間值守耗費更大的精力,往往一個簡單的磁碟使用率告警通知,就不得不爬起來進行處理,畢竟告警無小事,對於小問題,運維人也不能心存僥倖心理。雖然有著值班人員和團隊的支撐,但頻繁的告警還是讓運維人員精疲力竭,如何讓系統的穩定性提高,減輕一線人員的工作量,減輕一線人員的壓力?透過智慧運維,實現故障自愈將成為不可避免的選擇。

故障自愈是提升企業網路系統可用性和降低故障處理的人力投入,實現故障自愈從"人工處理"到"無人值守"的變革。透過實時發現告警,進行預診斷分析,判斷告警型別和級別,如果是一般告警,平臺進行自動恢復,如果是嚴重複雜告警則透過告警通知、運維工單等形式通知運維管理人員,進行人工處理。

 

針對運維中對故障自愈能力的需求,北京智和信通在實時監控告警的基礎上,搭載視覺化運維配置模組,透過賦予使用者自定義編輯故障自愈策略的能力,實現無需針對告警進行手動處置,只需預編排告警處理流程,平臺根據場景自動觸發,從而做到故障自愈。

在故障自愈方案中,核心是匹配使用者應用場景的故障自愈策略,一個符合使用者需求的策略,將為使用者節約80%的故障處理時間。因此,北京智和信通提供視覺化編排工具,支援以拖拽的方式快速簡單的完成作業流程的配置,將複雜的運維工作和任務轉變為一致的,可複用的、可度量和有效的工作流,實現自動化運維。透過拖拽流量編排能力,靈活定製自動化運維場景,運維操作過程和結果均視覺化呈現,並在策略中不限作業流程配置數量,全面滿足不同運維需求,透過高效能作業流量併發執行,解決告警批次處置的難題。

 

實時監控,秒級告警

北京智和信通故障自愈方案,提供7*24小時穩定不間斷監控網路,最小故障監視間隔可達到5秒。支援多種告警機制,自定義配置告警閥值,從眾多的事件和狀態中,系統將零散的狀態資訊,總結成為當前工作狀態,併產生告警,支援快速標示已經執行操作的告警,迅速定位告警裝置。

告警管理,風暴抑制

透過對告警機制以及閥值的設定,第一時間獲取準確的告警資訊,快速定位告警裝置,提升告警處理效率,極大的降低了因裝置故障給企業帶來的損失。包括事件過濾機制、故障事件上報機制、故障事件呈現過濾、故障事件入庫過濾、故障事件確認等處理機制,有效避免誤報和漏報。

智慧流程,全面管理告警

可實現快速的故障定位,能一步定位到發生故障的源頭裝置,及時處理好故障,有效地預防故障發生。支援以拓撲圖的方式回放歷史告警下的裝置告警變化、拓撲圖和鏈路告警變化,支援快進、後退等播放操作。

 

多渠道告警通知,實現無錯漏

故障可以透過介面顏色、告警列表、Email、釘釘、企業微信等方式發出通知,告警可以向上逐步追溯,按照從全域性→網路→裝置→資源的管理習慣來組織故障顯示。

自動化告警應急處置,實現快速自愈

以網路狀態監控、裝置效能監測為基礎,結合網路流量偵測功能,動態發現網路故障。智慧判斷告警型別及級別,自動觸發預設的故障處置流程,複雜告警指派工單專人處理,常規告警觸發安全策略全自動處理。

 

北京智和信通故障自愈方案,針對運維過程中的可用性場景,覆蓋故障發現、問題定位、自愈策略等各個階段。同時針對運維需求管理場景,提供網路拓撲、監控、自動化運維、裝置控制、資產監管、資料分析、視覺化展示、日誌分析、運維工單、流量監測等能力,並將其以“積木式”的開發方式進行結合,在實際應用中根據使用者的需求場景靈活組合,實現全方位智慧安全運維。

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70011401/viewspace-2930398/,如需轉載,請註明出處,否則將追究法律責任。

相關文章