某塑膠科技公司是由日本知名株式會社在中國投資的,以從事橡膠和塑膠製品業為主的生產製造企業。隨著企業資訊化建設提速,資訊化運用程度不斷提高,對網路基礎設施的管理也提出了更高要求,因此公司急需上線一款綜合運維平臺加強對整體網路的管理和維護。
專案現狀
隨著公司向智慧製造轉型,網路架構日趨複雜,支撐公司網路通訊和業務開展的軟硬體IT設施種類繁多,給運維工作造成極大壓力。
裝置型別:交換機、路由器、POE交換機、伺服器、AC、AP、資料庫、防火牆、虛擬機器、語音閘道器、硬碟錄影機、行為管理、光端機、印表機、動環監控等
裝置品牌:H3C、華為、ARUBA阿魯巴、HP、Lenovo、海康威視、飛塔、深信服、Cisco、國威、Windows Server、MySQL、PostgreSQL、SQL Server、Oracle、富士等
專案期望:
- 對網路中的所有網路裝置、虛擬機器、資料庫等進行統一管理,並提供清晰的網路拓撲圖;
- 對裝置進行實時監控,在出現故障時可以及時預警;
- 解決告警數量多,誤報、錯報情況嚴重,無法獲取真實故障資訊的問題;
- 解決裝置產生的trap日誌儲存展示分散,難以檢視的問題;
- 解決目前巡檢主要依靠人工進行的問題,提高巡檢效率和準確率;
- 具有美觀、清晰的介面和大屏,大屏支援上牆;
- 能夠和動環系統進行對接。
智和信通方案
透過多次溝通了解到其網路內的裝置種類、品牌型號均比較複雜,使用者對裝置監控運維的期待也較高,因此智和信通採用遠端+現場支援的方式進行安裝部署與支援,最終達成使用者期待的效果。
自動發現異構裝置並生成網路拓撲圖
智和信通充分利用產品自身強大的模型庫配置能力,在現有的監控模型基礎進行豐富,快速實現了對使用者全部品牌、型號裝置的納管。在專案部署過程中,僅需輸入IP地址,即實現了裝置發現與型別、品牌型號的識別,並自動搜尋出相應的裝置資源與裝置間的連結關係,自動生成網路拓撲。
更細節的裝置監控指標支援
智和信通對現有指標進行快速調整並根據使用者需要新增了大量使用者關注的核心指標,以滿足使用者對監控閾值、監控週期的需求。部分監控指標如下:
裝置型別 |
監控指標 |
交換機/路由器 |
線上狀態、響應時間、執行時間、CPU使用率、記憶體使用率、介面接收/傳送流量、介面接收/傳送頻寬、介面接收/傳送丟包率等 |
POE交換機 |
線上狀態、電源狀態、響應時間、執行時間、CPU使用率、記憶體使用率、埠狀態、埠流量、光口、電口、語音口、包轉發率等 |
伺服器 |
線上狀態、響應時間、CPU使用率、記憶體使用率、磁碟使用率、磁碟容量預測、程序、介面接收/傳送流量等 |
AC |
線上狀態、響應時間、CPU使用率、記憶體使用率、介面接收/傳送流量、射頻傳輸重傳幀比率、當前連線使用者數、當前斷開連線使用者數等 |
AP |
線上狀態、介面接收/傳送流量、關聯的站點總數、關聯失敗的站點總數、使用者線上時間等 |
資料庫 |
線上狀態、連線數、併發連線數、最大連線數、表空間、死鎖等 |
防火牆 |
線上狀態、CPU使用率、記憶體使用率、介面接收/傳送流量、介面接收/傳送速率、HTTP請求數、錯誤率等 |
虛擬機器 |
線上狀態、CPU使用率、記憶體使用率、磁碟讀寫IO、磁碟讀寫速率、網路接收/傳送速率等 |
硬碟錄影機 |
線上狀態、CPU使用率、記憶體使用率、磁碟使用率、磁碟容量預測、 |
行為管理 |
線上狀態、CPU使用率、記憶體使用率、活躍使用者數、上線使用者數等 |
差異呈現裝置核心效能指標,感知裝置執行態勢
為不同型別和應用場景下的裝置建立差異化效能指標,全面採集、儲存、分析效能資訊,並按照時間、資源、效能型別等多種維度,圖形、表格等多種形式展示實時效能和歷史效能。透過智慧演算法分析歷史資料,對磁碟容量、交換機埠容量、機房機櫃容量進行展示和預測分析,並根據容量可使用時間進行自定義預警。
事件、日誌集中治理,異常告警
全面收集裝置傳送的Trap、Syslog、Filter Alarm等事件、日誌資料,解析、提取有效資訊,將其儲存、展示為可統計分析的結構化資料,透過配置告警規則和場景,將異常事件、日誌自動轉化為告警,定位其影響範圍。
深入分析、處理異常故障資訊,精確告警
自定義配置告警閾值,並從眾多的事件、日誌和狀態資訊中分析提煉異常資料並轉化為告警。在告警資訊產生後,採用自動去重、風暴抑制、關聯聚合、維護期時間遮蔽、依賴遮蔽等多種智慧告警降噪機制,對各類告警進行自動壓縮收斂,減少無效告警,一步定位發生故障的源頭裝置。快速檢索異常問題關聯涉及的各項維度與影響範圍,快速定位問題邊界,直達故障根因。
提供介面顏色、提示聲、光效閃爍、資訊列表、Email、簡訊、釘釘、企業微信、個人微信等多種通知渠道。
自動化巡檢、全面解放人力
根據使用者日常運維工作流程自定義巡檢策略,對裝置的執行情況進行統計和報表生成。透過平臺內人工觸發或定時觸發的方式,將巡檢工作託管至平臺自動執行,減少人工干預,實現對裝置的定期快速檢查。
大屏上牆運維資訊更集中
在實施的過程中,僅透過智慧電視上的安卓瀏覽器訪問平臺,即實現運維大屏上牆,直觀清晰地傳達運維資料分析結果,幫助使用者由宏觀到微觀更快地瞭解網路運維現狀,做出更具時效性的決策。
無縫對接使用者現有動環系統,實現聯合監控
使用者現場已在使用某廠商的動環監控系統,智和信通採取快速對接的方式打通和此係統間的資料流轉。在智和信通平臺內接收溫度、溼度、漏水、煙感、配電、UPS、空調等裝置的實時狀態資訊,並對異常資料進行清洗、告警。
應用價值
在專案的實施過程中,我們清晰地感知到納入方案中監管的IT軟硬體設施支撐著使用者上層眾多的,如品控、防錯料、檔案管理、合同管理、薪資、預算、人事等業務系統,網路的狀態強烈影響著使用者業務系統的可用性和效能,最終也將影響整體企業的辦公體驗。
透過部署智和信通綜合監控運維方案實時監控使用者網路與機房內大量異構的交換機、路由器、伺服器、AC/AP、資料庫、防火牆、虛擬機器、語音閘道器、硬碟錄影機、行為管理等裝置,及時發現並預警潛在問題,從而避免或減少故障帶來的負面影響。同時,透過快速對接現有動環系統的方式,實現機房動力、環境系統的補充監控,保障機房執行的物理安全和環境穩定。