交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

北京智和信通發表於2024-04-30

交換機在網路架構中佔據重要位置,連線各種裝置和系統起到橋樑的作用,控制資料流動,使網路資料傳輸更加穩定高效。因此,交換機的狀態必將影響網路的可靠性和可用性。

北京智和信通交換機管控方案統一納管網路中不同型別、不同品牌、不同型號的交換機,透過遠端監控、遠端配置等技術,實現交換機自動檢測、自動報警、自動修復等功能,並透過形象化的虛擬場景和真實資料相結合,動態感知交換機的執行態勢,透過對交換機的有效監控和管理,提升網路的執行效率,保障網路穩定。

第1章 交換機監控指標

方案可對各個品牌、型號交換機的統一監管,獲取最新執行狀態。目前,已實現對國內外常見交換機品牌,如:華為、H3C、思科、銳捷、中興等,小眾或較為老舊的品牌型號也可透過靈活可配的模型庫進行擴充套件適配。

1.1.常見監控指標

內建埠、頻寬、吞吐量、流量、丟包率、錯誤包、執行狀況等多種資源監測點和監測指標,未覆蓋的資源和指標也可以透過模型庫不斷進行擴充。

裝置型別

資源監測點

監測指標

交換機

Ping

狀態

平均響應時間(ms)

抖動(ms)

……

裝置執行時間

交換機本次啟動後執行時間

……

電源

電源狀態

……

風扇

風扇狀態

風扇編號

轉速(轉/s)

……

溫度

溫度狀態

當前溫度(℃)

CPU

CPU大小

CPU使用率(%)

CPU空閒

……

記憶體

記憶體大小

記憶體使用率(%)

空閒記憶體

……

網路介面

狀態(up、down)

廣播包(包/秒)

每秒傳送資料包(個/s)

每秒接收資料包(個/s)

傳送包錯誤率(%)

接收包錯誤率(%)

傳送丟包率(%)

接收丟包率(%)

接收頻寬使用率(%)

傳送頻寬使用率(%)

傳送流量(Kbit/s)

接收流量(Kbit/s)

誤位元速率(%)

……

光口

狀態(up、down)

廣播包(包/秒)

傳送光功率(dBm)

接收光功率(dBm)

每秒傳送資料包(個/s)

每秒接收資料包(個/s)

傳送包錯誤率(%)

接收包錯誤率(%)

傳送丟包率(%)

接收丟包率(%)

接收頻寬使用率(%)

傳送頻寬使用率(%)

傳送流量(Kbit/s)

接收流量(Kbit/s)

誤位元速率(%)

……

1.2.交換機品牌型號及指標擴充套件

方案採取使用者自定義擴充套件交換機品牌、型別及其資源的方式,賦予使用者強大的適配能力,最大可能地實現對不同時期、不同品牌、不同型號交換機的管控。支援自定義交換機型別、交換機資源、故障監視器、效能監視器、TRAP監視器等,提供配置交換機模板的功能,允許使用者自定義交換機真實皮膚圖。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

第2章 交換機實時監控

方案透過智慧演算法自動發現網路中心、匯聚、接入層交換機以及交換機間、交換機和其他裝置間的鏈路關係,實時監控交換機的各項執行指標。

2.3.視覺化監控

2.3.1.一鍵式自動發現

在網路可達範圍內,自動獲取網路中的交換機及其他裝置,識別裝置間的連線關係。智慧識別交換機的廠商、型號,生成資源邏輯拓撲或交換機皮膚圖,匹配故障/效能監視器,透過可視拓撲動態展示交換機、鏈路的執行狀態。

2.3.2.自動生成網路拓撲

方案以圖形化方式系統展現網路拓撲關係,支援樹形結構和平面結構的聯動展示,也可以按片區、按地域、按層級等多種佈局方式劃分網路,在拓撲中以不同顏色圖示展現交換機的實時狀態資訊。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

2.3.3.視覺化展示資源

在拓撲圖的基礎上,進一步展示交換機的細節,可以是其物理元件,也可以是使用者定義的其他監控物件。提供資源邏輯拓撲,以圖形方式展示記憶體、CPU、埠、光口、電源等資源資訊,對交換機進行細化監控,實時告警,對裝置進行事前管理,降低故障發生率。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

2.3.4.交換機真實皮膚圖

提供交換機真實皮膚圖,展現網口、板卡、光口、燈、電源、風扇等交換機皮膚資訊。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

2.3.5.智慧識別鏈路

智慧識別鏈路關係,支援自動發現或手動編輯交換機之間、交換機和其他裝置之間的鏈路、執行狀態、流量效能資料。透過直觀的拓撲圖幫助網路管理人員實時瞭解網路連結情況,配置情況及裝置執行情況。

支援展示上傳流量、下載流量、狀態、接收/傳送資料包量、上傳下載丟包率、包錯誤率、上傳下載頻寬使用率、連通狀態、管理狀態等。

2.3.6.智慧搜尋下掛裝置

透過多種智慧發現演算法,自動搜尋發現交換機、AP等連線的下掛裝置,分析下掛裝置的IP、MAC、埠等資訊。自動生成拓撲檢視,簡化新增刪除等操作,提升管理效率。

2.4.多維度效能態勢感知

實時監測並感知交換機的相關效能情況,多維度處理、分析、展示交換機效能態勢,實現“可觀、可管、可控”。

2.4.1.全面採集交換機效能

全面採集交換機的資源、應用、服務等效能資訊,支援按照時間、資源、效能型別等多種維度,圖形、表格等多種形式展示交換機資源、應用、服務等效能資訊。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

2.4.2.實時、歷史效能分析

對實時、歷史效能資料進行統計分析,透過曲線圖、柱狀圖或表格等形象化地展示,按天、星期、月檢視效能指標變化。運維人員能隨時把握交換機效能變化態勢,防患於未然。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

2.4.3.多交換機效能對比

支援選擇多個交換機進行同維度效能資料分析,提供視覺化效能對比檢視

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

2.5.日誌與事件管理

接收交換機主動傳送如介面狀態、介面速率、IP地址衝突、廣播風暴、配置修改、許可權變更等事件與日誌訊息,集中儲存、解析處理後,異常資訊及時地通知使用者。透過統一介面集中管理事件與日誌,提高其完整性和可追溯性,幫助使用者快速定位問題並採取相應的解決措施。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

2.6.故障告警與智慧收斂

搭載多種告警機制,自定義配置告警閾值,具備主動的故障監控功能,從眾多的事件和狀態中,系統地將零散的狀態資訊,總結成為當前狀態,並對異常狀態進行告警,第一時間獲取準確的告警資訊,快速標示已執行操作的告警,迅速定位產生告警的交換機,提升告警處理效率,極大降低因交換機故障帶來的損失。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

告警管理採用自動去重、風暴抑制、關聯聚合、維護期時間遮蔽、依賴遮蔽等多種智慧告降噪機制,透過AI演算法,對各類告警進行自動壓縮收斂,減少90%的無效告警,抑制告警風暴,有效避免誤報和漏報,直達故障根因。

2.7.自動化交換機狀態巡檢

可自定義巡檢策略,預設執行時間進行自動化巡檢,巡查交換機實時執行狀態,並向指定郵箱傳送結果報告,實現對交換機的定期檢查,把握網路執行中的易出現問題的環節,做到預防為先。可自行選擇要統計的網路、交換機、資源、流量、效能、故障型別、監視器型別、時間範圍、報表排序規則、過濾規則等生成巡檢報表。支援統計圖表匯出或列印。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

2.8.逐層下鑽的流量透視

提供端到端的流量透視能力,從交換機、介面、IP、服務、應用、會話等層級的實時流量監控和歷史流量分析,識別頻寬消耗較大的應用程式、服務、協議或IP地址,避免網路容量過載,並提升終端使用者網路體驗。幫助使用者進行流量趨勢分析、網路最佳化、網路監控等工作,併為網路規劃、最佳化調整和業務發展提供基礎依據。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

第3章 交換機遠端控制和編排式配置

方案提供交換機遠端控制的能力,採用“監控+運維+控制”的方式,將不同型別、不同型號、不同廠商的交換機統一納入控制,集中管理。

3.1.交換機遠端配置執行

將週期性、重複性、規律性的大量日常運維工作,如交換機策略配置、故障自愈、自動巡檢等,轉化為依託於平臺的自動化執行。透過深入交換機協議的控制能力,實現對交換機諸如准入控制、訪問控制、QOS策略配置、全網流量策略配置、埠限速、埠開啟關閉、一鍵開關機、策略備份對比等功能。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

3.2.交換機遠端配置──以(訪問控制為例)

以對華為交換機進行配置,使用高階ACL限制不同網段使用者互相訪問為例。

效果要求:為公司中不同部門劃分不同網段的IP地址,並將不同網段劃分在不同VLAN中,限制不同網段之間的相互訪問。

第一步:將交換機納入平臺進行統一監管。

第二步,配置交換機策略。主要策略包括:配置高階ACL和基於ACL的流分類,使交換機可以對不同部門間互訪的報文進行過濾。配置流行為,拒絕匹配上ACL的報文透過。 配置並應用流策略,使ACL和流行為生效。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

第三步,檢視交換機策略,並與前期策略進行對比。對比基準可以是某一次的備份或專用的基線檔案,對策略異常變化進行告警。

3.3.配置備份、對比與恢復

支援配置檔案批次備份、下載、週期性備份、檢視等,對交換機的多個備份檔案進行對比。定期自動對交換機配置進行巡檢備份,並可進行對比分析,為使用者管理網路做出合理的建議提供資料支撐,支援進行已備份配置間的對比分析和針對性的配置恢復。

3.4.配置合規性審計

交換機配置的穩定與合規至關重要,錯誤或未經認證的配置變更都可能導致嚴重的網路故障,方案透過本次執行結果與上次執行結果或基線檔案的對比,當配置出現異常時進行自動告警,並可結合故障自愈能力,自動回滾到信任的版本。

第4章 資產CMDB管理

透過構建交換機資產資料庫,將交換機的資訊包括資產編號、資產名稱、品牌型號、來源、購買日期、埠數量、介面型別、負責人等,以及維保到期時間、維保單位等維保資訊統一管理。

動態感知納入監控的資產執行狀態,並以圖譜的方式呈現資產與其他資產、配品配件、網路鏈路、使用人等靜態關聯關係。

交換機統一監控和遠端控制:自動發現、自動監控、自動告警、自動修復

相關文章