輕鬆定位硬體故障方法-日誌分析
同事發現某臺機器上message日誌數量突然暴增,簡單檢視了下有記憶體相關的報錯,所以轉交給我來檢視。
Message日誌
進入伺服器檢視message日誌,先看看同事說的告警到底是什麼,如下圖:
還真是,通道3,第一個槽位的記憶體發生故障了。但是,我只知道A1/B1/A2/B2,所以我還是繼續。
Ipmitool工具
不論怎樣,Ipmitool工具檢視了下,確實是有記憶體告警,如下圖
雖然告警,可是無法定位大具體哪根記憶體壞了呀
IDRAC-web
不論怎樣,我們還有DELL自帶的IDRAC的web頁面可以檢視硬體狀態,登陸看看,先看看日誌,這裡有了吧,B6記憶體槽故障
再看看硬體狀態,B6記憶體存在告警
就此,我找到了我想要的資訊,定位到了B6記憶體故障,需要更換,至於如何更換,需要注意哪些事項,以後再說。
總結
硬體安全是伺服器底層的安全,一定要做好各項硬體監控,及時處理硬體故障,否則,你們懂的。介紹幾種常見的涉及硬體故障分析的日誌:
- messages日誌
- dmesg日誌
- ipmitool sel list檢視硬體日誌
- 遠端管理頁面上的日誌(DELL的IDRAC,HP的ILO,IBM的IMM等等)
- smart日誌
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69901823/viewspace-2996008/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- <Win7硬體故障分析>Win7
- IT小白也能輕鬆get日誌服務---使用Nginx模式採集日誌Nginx模式
- 電腦當機的原因分析:硬體故障
- ELK 日誌分析體系
- 日誌分析-apache日誌分析Apache
- GoAccess 開源日誌輕工具部署與分析Go
- Oracle listener log 日誌分析方法Oracle
- 結合 AOP 輕鬆處理事件釋出處理日誌事件
- 輕鬆上手移動互聯——百度SiteApp建造日誌APP
- 輕鬆搞定對容器例項日誌設定定期清理和回捲
- raid5陣列硬體故障修復方法/條帶分析/陣列重組AI陣列
- [日誌分析篇]-利用ELK分析jumpserver日誌-日誌拆分篇Server
- Linux 硬體故障排除指南Linux
- 輕鬆gps定位:AnyGo最新啟用版中文Go
- 使用PING命令輕鬆判斷TCP/IP故障TCP
- 輕鬆上手Fluentd,結合 Rainbond 外掛市場,日誌收集更快捷AI
- 玄機-第二章日誌分析-apache日誌分析Apache
- Apche日誌系列(4):日誌分析(轉)
- 日誌分析logmnr (Logminer) 使用方法
- oracle logminer分析線上 離線日誌方法Oracle
- FDOAGENT日誌分析
- crash日誌分析
- awk分析日誌
- pg日誌分析
- 如何輕鬆歸檔檔案?2種方法輕鬆建立歸檔檔案!
- 給日誌打標籤,讓你的日誌定位再無困難
- 輕鬆清除Windows XP下光纖撥號設定故障(轉)Windows
- 輕量級日誌收集方案LokiLoki
- 新硬體環境下日誌模組的設計與演進
- 刪除SQL Server日誌的具體方法SQLServer
- Docker 容器日誌分析Docker
- JAVA GC日誌分析JavaGC
- perl分析apache日誌Apache
- 日誌收集分析-heka
- awstats分析web日誌Web
- mysqldumpslow日誌分析MySql
- LOGMINER日誌分析
- 日誌採集/分析