儲存裝置異常告警,如何秒速定位問題?

Linksla發表於2023-02-03

對運維來說,保證業務系統的穩定、可用、安全是工作核心。盯系統、伺服器或模組元件,檢視日誌、調整引數、效能調優、配置更改、響應需求等工作都是圍繞這個目標而進行。

隨著企業規模不斷擴大,伺服器的日常管理也逐漸繁雜。透過人工頻繁的更新、部署、管理,勢必會耗費大量的時間,且容易產生操作上的疏漏。

年初某三甲醫院將IT資產接入公司平臺進行監控。其中,有一臺儲存裝置,接入平臺後立刻生成告警,儲存裝置狀態異常。



大家都知道,儲存裝置故障,會導致資料丟失或上層應用不可以用等嚴重後果。

MOC工程師接到告警後,開啟詳情介面,檢查執行引數。從圖上我們可以看到,這臺儲存裝置,儲存狀態引數異常(other1)。


繼續開啟storage_battery引數介面,看到電池2的狀態引數異常。可以確定是電池2故障。


MOC工程師馬上通知現場工程師檢查電池狀態,確認電池故障後,及時進行更換。

使用者的儲存剛接入平臺,就能迅速檢測到電池故障,避免資料丟失或業務應用故障的發生,高效解決。真正成為IT工程師放心、省心的運維管家。

LinkSLA智慧運維管家,透過對接入的全鏈路IT資產提供7*24小時全棧監控,實時監測到諸如硬體故障,如CPU使用率,硬碟空間,資料庫死鎖卡頓,網路ping不通,網路丟包異常。除此之外,將專業的運維技術經驗與大資料、機器學習技術相結合,融入到運維繫統中代替人力,解決更大規模上的運營效率問題。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70013542/viewspace-2933940/,如需轉載,請註明出處,否則將追究法律責任。

相關文章