Centos 伺服器系統記憶體故障排查
導讀 | 該筆記主要記錄一下如何排查指定伺服器中的指定記憶體條是否損壞。 |
1.記憶體故障排查
因為 68 – 71 軟SBC伺服器都是 7系統,所以我們可以通過以下 來排查記憶體是否出現損壞。
grep "[0-9]" /sys/devices/system/edac/mc/mc/csrow/ch*_ce_count
1> count不為0表示有錯誤
2> mc代表第幾個cpu,
3> csrow記憶體通道,
4> ch第幾個記憶體
EDAC即error detection and correction(錯誤檢測與糾正),是 內部的機制。在上面的日誌中,可以清楚地看出是記憶體讀錯誤。MC即memory controller(記憶體控制器)。CE則代表correctable error,是ECC記憶體中可以糾正的錯誤,相對地還有UE(uncorrectable error)。為了摸清是哪些記憶體出了問題,找出所有記憶體的CE計數,由上圖可知,第四塊記憶體出現了故障。
通過 dmidecode -t memory
,可以檢視每個DIMM
2.CPU排查 cat /sys/devices/system/cpu/cpu*/online
原文來自:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69955379/viewspace-2899782/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Java 8 記憶體管理原理解析及記憶體故障排查實踐Java記憶體
- 故障分析 | 租戶 memstore 記憶體滿問題排查記憶體
- java 堆外記憶體排查Java記憶體
- 排查Java的記憶體問題Java記憶體
- 在Linux中,如何進行系統故障排查?Linux
- Linux記憶體子系統——Locking Pages(記憶體鎖定)Linux記憶體
- 伺服器網路故障如何排查伺服器
- JAVA堆外記憶體排查小結Java記憶體
- nodejs爬蟲記憶體洩露排查NodeJS爬蟲記憶體洩露
- JVM堆外記憶體問題排查JVM記憶體
- redisson記憶體洩漏問題排查Redis記憶體
- 伺服器效能指標(三)——記憶體使用分析及問題排查伺服器指標記憶體
- 如何檢視linux系統中空閒記憶體/實體記憶體使用/剩餘記憶體Linux記憶體
- 虛擬記憶體系統——瞭解記憶體的工作原理記憶體
- 【JVM故障問題排查心得】「記憶體診斷系列」JVM記憶體與Kubernetes中pod的記憶體、容器的記憶體不一致所引發的OOMKilled問題總結(上)JVM記憶體OOM
- 【JVM故障問題排查心得】「記憶體診斷系列」JVM記憶體與Kubernetes中pod的記憶體、容器的記憶體不一致所引發的OOMKilled問題總結(下)JVM記憶體OOM
- Sieve—Android 記憶體分析系統Android記憶體
- 作業系統-記憶體管理作業系統記憶體
- 作業系統——記憶體管理作業系統記憶體
- MySQL記憶體管理,記憶體分配器和作業系統MySql記憶體作業系統
- netty 堆外記憶體洩露排查盛宴Netty記憶體洩露
- 一次django記憶體異常排查Django記憶體
- 伺服器的路由故障怎麼排查伺服器路由
- 記一次"記憶體洩露"排查過程記憶體洩露
- 計算機作業系統——虛擬記憶體與實體記憶體計算機作業系統記憶體
- GreatSQL記憶體消耗異常排查攻略:從系統到應用層面的深入分析SQL記憶體
- 【作業系統】記憶體管理概述作業系統記憶體
- CentOS限制實體記憶體大小方法CentOS記憶體
- 什麼是伺服器記憶體?如何選擇伺服器記憶體?伺服器記憶體
- 記IPSec VPN對接故障的排查
- 記錄一次記憶體洩漏排查過程記憶體
- iOS 記憶體洩漏排查方法及原因分析iOS記憶體
- 一次 Java 記憶體洩漏的排查Java記憶體
- Python實現記憶體洩露排查的示例Python記憶體洩露
- Dell R720 記憶體糾錯比率超限 更換記憶體引起的故障記憶體
- Centos 系統簡單排查流量異常問題CentOS
- 伺服器記憶體和普通記憶體的不同點在哪伺服器記憶體
- 作業系統——記憶體管理學習筆記作業系統記憶體筆記