使用shell批量監控磁碟壞塊(一)

jeanron100發表於2015-12-15

原文網址 : http://blog.itpub.net/23718752/viewspace-1872978/

硬體的監控其實還是蠻重要的，這個部分在嘉年華中也著重強調過，不過做起來確實還是有一些難度，我們也嘗試了一些方法，最終準備兩條腿走路，一邊使用中控的方式來統一監控管理，同事考慮把硬體監控揉入zabbix的監控體系之中。今天來說使用統一監控的方式。
在強調硬體監控的重要性時，最好的說明方式就是用資料說話。
下面的是我在Oracle嘉年華分享中提到的一個部分，對於監控硬體監控還是很容易忽略的一個環節，但是又是最無奈的一個環節。
在各類故障之中，硬體故障佔用了絕大部分的故障比例。當然這個數字也有一些針對性，不具有普遍性。不過總體來看硬體故障中的主機板故障等等都是重中之中。

那麼這些故障的影響情況怎麼樣呢，我們再來看看一個圖形，下面說明的是累計幾年的故障影響時長。
硬體故障的影響時長几乎就是滿配了，一臺伺服器故障影響時長1分鐘，那麼幾千臺伺服器幾年下來就是幾千分鐘，這個數字是這麼解讀的。

好了，強調了硬體故障，這些監控也要開始做了。對我們來說一個比較直接而且相對來說容易實現的方式就是硬碟的監控了，其中的磁碟壞塊就是一個典型例子了。
硬體壞塊的監控做好了，其它的監控其實也就是觸類旁通，縫縫補補即可。
總體的思路如下：
是通過一臺中控機器來訪問所有的伺服器，然後傳送響應的命令，然後在各個伺服器本地執行，回撥返回到中控機器。所有每臺伺服器都要統一部署一個類似客戶端的軟體，目前我先採用MegaCli來統一部署。

那麼監控的實現方式方式和實現細節呢，我們來用下面的圖形來說明這個流程。

首先在中控的機器中採用遠端呼叫的方式來呼叫各個伺服器端的megacli，得到壞塊的情況
然後大批量的伺服器就會生成一個報告來，得到了報告就可以做進一步的改進，把它格式化一番，我們可以通過郵件的方式來顯示html的表格效果。
簡訊中可以得到一個概要的資訊，可以直接統計出一個概要的壞塊數作為參考，如果壞塊數小於10個，暫時可以不需要進一步處理。
上面的也是一個實現思路，目前框架已經完成，html郵件已經實現，後面給大家共享一個第三方指令碼，可以做美化的效果。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/23718752/viewspace-1872978/，如需轉載，請註明出處，否則將追究法律責任。

【shell】磁碟監控指令碼
2024-04-25
指令碼
監控磁碟使用率的shell指令碼
2018-10-23
指令碼
用於自動監控磁碟使用情況的 Shell 指令碼
2021-10-24
指令碼
5. 監控磁碟使用率
2019-01-15
用 Linux Shell 指令碼來監控磁碟使用情況併傳送郵件
2019-05-18
Linux指令碼
15. 監控磁碟IO使用率
2019-02-03
磁碟IO效能監控
2018-06-27
如何用bash shell 指令碼監控 Linux記憶體、磁碟和 CPU?
2022-05-13
指令碼Linux記憶體
RabbitMQ - 記憶體磁碟監控
2021-06-09
MQ記憶體
問題：未清空磁碟被新增到磁碟組觸發壞塊
2020-03-26
使用Shell指令碼程式監控網站URL是否正常
2019-07-17
指令碼網站
shell監控mysql 8.0資料庫
2023-02-14
MySql資料庫
shell監控mysql 5.7資料庫
2023-02-14
MySql資料庫
分享實用監控指令碼:使用Shell檢查程式是否存在
2019-09-26
指令碼
shell監控服務程式是否啟動
2018-09-17
Shell 系統資訊監控指令碼
2024-08-31
指令碼
在 Linux 中如何使用 iotop 和 iostat 監控磁碟 I/O 活動？
2019-05-05
LinuxiOS
PowerShell 指令碼來監控 CPU、記憶體和磁碟使用情況：
2024-09-23
指令碼記憶體
Linux中監控磁碟分割槽及使用情況的命令有哪些?
2022-06-24
Linux
Linux中監控磁碟分割槽和使用情況的幾個工具
2021-09-27
Linux
iOS使用shell指令碼批量修改屬性
2019-04-04
iOS指令碼
監視磁碟使用情況
2024-05-29
在Linux中，如何進行磁碟效能監控？
2024-05-24
Linux
shell指令碼：監控MySQL服務是否正常
2021-09-09
指令碼MySql
Shell指令碼監控MySQL主從狀態
2020-12-14
指令碼MySql
使用Admin監控
2018-04-19
iOS使用Shell指令碼批量修改類名稱
2019-04-04
iOS指令碼
通過shell指令碼批量新增使用者
2019-12-09
指令碼
TenSunS監控REDIS：使用一個redis_exporter監控所有的Redis例項
2024-11-03
RedisExport
linux實現shell指令碼監控磁碟記憶體達到閾值時清理catalina.out日誌
2020-07-24
Linux指令碼記憶體
shell實戰之Linux主機系統監控
2019-04-05
Linux
shell指令碼監控啟動停止weblogic服務
2018-09-16
指令碼Web
SpringBoot使用prometheus監控
2019-03-17
Spring BootPrometheus
使用Prometheus監控Flink
2020-07-27
Prometheus
Zabbix 5.0：磁碟自動發現和讀寫監控
2021-05-28
使用Python建立一個系統監控程式
2020-05-18
Python
阿里雲容器Kubernetes監控(一)-資源監控
2018-04-02
阿里
Java 監控基礎 - 使用 JMX 監控和管理 Java 程式
2021-12-09
Java
upptime：使用GitHub Actions監控你的網站健康監控
2022-07-05
Github網站

使用shell批量監控磁碟壞塊(一)

相關文章