如何用Nagios遠端執行外掛(NRPE)來檢測伺服器記憶體使用率

贊 回覆發表於2014-11-02

先前的教程中,我們已經見到了如何在Nagios設定中設定Nagios遠端執行外掛(NRPE)。然而,監控記憶體使用率的指令碼和外掛並沒有在原生的Nagios中。本篇中,我們會看到如何配置NRPE來監控遠端伺服器上的記憶體使用率。

我們要用的監控記憶體的指令碼在Nagios 市場上,在建立者的Github倉庫中也可以找到。

假設我們已經安裝了NRPE,我們首先在我們想要監控的伺服器上下載指令碼。

準備遠端伺服器

在 Debain/Ubuntu 中:

# cd /usr/lib/nagios/plugins/
# wget https://raw.githubusercontent.com/justintime/nagios-plugins/master/check_mem/check_mem.pl
# mv check_mem.pl check_mem
# chmod +x check_mem 

在 RHEL/CentOS 中:

# cd /usr/lib64/nagios/plugins/ (or /usr/lib/nagios/plugins/ for 32-bit)
# wget https://raw.githubusercontent.com/justintime/nagios-plugins/master/check_mem/check_mem.pl
# mv check_mem.pl check_mem
# chmod +x check_mem

你可以通過手工在本地執行下面的命令來檢查指令碼的輸出是否正常。當使用NRPE時,這條命令應該會檢測空閒的記憶體,當可用記憶體小於20%時會發出警告,並且在可用記憶體小於10%時會生成一個嚴重警告。

# ./check_mem -f -w 20 -c 10 

OK - 34.0% (2735744 kB) free.|TOTAL=8035340KB;;;; USED=5299596KB;6428272;7231806;; FREE=2735744KB;;;; CACHES=2703504KB;;;;

如果你看到像上面那樣的輸出,那就意味這命令正常工作著。

現在指令碼已經準備好了,我們要定義NRPE檢查記憶體使用率的命令了。如上所述,命令會檢查可用記憶體,在可用率小於20%時發出警報,小於10%時發出嚴重警告。

# vim /etc/nagios/nrpe.cfg 

對於 Debian/Ubuntu:

command[check_mem]=/usr/lib/nagios/plugins/check_mem  -f -w 20 -c 10

對於 RHEL/CentOS 32 bit:

command[check_mem]=/usr/lib/nagios/plugins/check_mem  -f -w 20 -c 10

對於 RHEL/CentOS 64 bit:

command[check_mem]=/usr/lib64/nagios/plugins/check_mem  -f -w 20 -c 10

準備 Nagios 伺服器

在Nagios伺服器中,我們為NRPE定義了一條自定義命令。該命令可儲存在Nagios內的任何目錄中。為了讓本教程簡單,我們會將命令定義放在/etc/nagios目錄中。

對於 Debian/Ubuntu:

# vim /etc/nagios3/conf.d/nrpe_command.cfg 

define command{
        command_name check_nrpe
        command_line /usr/lib/nagios/plugins/check_nrpe -H '$HOSTADDRESS$'  -c '$ARG1$'
}

對於 RHEL/CentOS 32 bit:

# vim /etc/nagios/objects/nrpe_command.cfg 

define command{
        command_name check_nrpe
        command_line /usr/lib/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
        }

對於 RHEL/CentOS 64 bit:

# vim /etc/nagios/objects/nrpe_command.cfg 

define command{
        command_name check_nrpe
        command_line /usr/lib64/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
        }

現在我們定義Nagios的服務檢查

在 Debian/Ubuntu 上:

# vim /etc/nagios3/conf.d/nrpe_service_check.cfg 

define service{
        use                            local-service
        host_name                      remote-server
        service_description            Check RAM
        check_command                  check_nrpe!check_mem
}

在 RHEL/CentOS 上:

# vim /etc/nagios/objects/nrpe_service_check.cfg 

define service{
        use                            local-service
        host_name                      remote-server
        service_description            Check RAM
        check_command                  check_nrpe!check_mem
}

最後我們重啟Nagios服務

在 Debian/Ubuntu 上:

# service nagios3 restart 

在 RHEL/CentOS 6 上:

# service nagios restart 

在 RHEL/CentOS 7 上:

# systemctl restart nagios.service 

故障排除

Nagios應該開始在使用NRPE的遠端伺服器上檢查記憶體使用率了。如果你有任何問題,你可以檢查下面這些情況。

  • 確保NRPE的埠在遠端主機上是總是允許的。預設NRPE的埠是TCP 5666。
  • 你可以嘗試通過執行check_nrpe 命令: /usr/lib/nagios/plugins/check_nrpe -H remote-server 手工檢查NRPE操作。
  • 你同樣可以嘗試執行check_mem 命令:/usr/lib/nagios/plugins/check_nrpe -H remote-server –c check_mem
  • 在遠端伺服器上,在/etc/nagios/nrpe.cfg中設定debug=1。重啟NRPE服務並檢查這些日誌檔案,/var/log/messages (RHEL/CentOS)或者/var/log/syslog (Debain/Ubuntu)。如果有任何的配置或者許可權錯誤,日誌中應該包含了相關的資訊。如果日誌中沒有反映出什麼,很有可能是由於請求在某些埠上有過濾而沒有到達遠端伺服器上。

總結一下,這邊教程描述了我們該如何除錯NRPE來監控遠端伺服器的記憶體使用率。過程只需要下載指令碼、定義命令和重啟服務就行了。希望這對你們有幫助。


via: http://xmodulo.com/2014/09/monitor-server-memory-usage-nagios-remote-plugin-executor.html

作者:Sarmed Rahman 譯者:geekpi 校對:wxy

本文由 LCTT 原創翻譯,Linux中國 榮譽推出

相關文章