監控Linux系統下的host和service

nginx_web發表於2012-06-07

 

 

    監控遠端Linux/Unix主機上的本地資源可以通過NRPE外掛來實現,下面來看NRPE在監控伺服器(也就是安裝Nagios伺服器的機器)和遠端主機(也就是被監控的伺服器)上的安裝和配置。

 

認識NRPE

 

    NRPE外掛的設計原理就是要允許Nagios在遠端Linux/Unix主機上執行Nagios外掛,以便對遠端Linux/Unix主機進行檢測,這麼做的主要原因在於要求Nagios監控遠端Linux/Unix主機的本地("local")資源(例如,CPU負載、記憶體使用率、交換分割槽使用率、當前登入使用者數、磁碟使用率、程式狀態等)。由於這些資源通常不暴露在外部的機器,因此類使用NRPE代理必須安裝在遠端Linux/ Unix機器。

 

注意,可能會通過SSH遠端執行Linux/ Unix機器上Nagios外掛,在外掛中有一個check_by_ssh外掛,這外掛能夠實現安全傳輸。使用SSH將會比NRPE外掛更安全,但是有可能會是的遠端主機和監控主機上的CPU負載過載,如果監控上百臺機器或者上千臺機器那麼這將會是一個問題。因此,許多Nagios管理員選擇了通過NRPE外掛,因為這樣將會是的CPU負載降低。

 

    如果環境不是很複雜——這裡說的複雜不是網路或者服務複雜,而是人員的複雜,那麼也沒有必要使用安全傳輸。

 

圖解NRPE

 

 

    從圖中看出,NRPE分為兩部分:

 

u       check_nrpe 外掛,位於監控機器Nagios本地;

u       NRPE 守護程式,位於遠端被監控的Linux/Unix主機;

 

    Nagios需要從遠端Linux/Unix主機監控服務資源時,需要進行以下步驟:

 

n         Nagios將會執行check_nrpe外掛,並且告訴它什麼樣的服務需要監測;

n         外掛check_nrpe將會聯絡遠端主機的NRPE守護程式,根據需要可以選擇SSL保護連線;

n         NRPE守護程式選擇適當的Nagios外掛監測服務或者資源;

n         服務檢測的結果將會通過check_nrpe外掛傳遞到NRPE守護程式,換句話說就是將被監控主機上監控的結果傳回到Nagios的守護程式;

 

    這裡需要說明的一點是NRPE需要將Nagios 外掛安裝在遠端的Linux/Unix主機上,如果沒有安裝這些外掛,那麼NRPE守護程式什麼也幹不了。

 

使用方法

 

直接檢查

 

    大多數情況是直接使用NRPE來監控遠端Linux/Unix主機上的"local" 或者 "private",即“本地”或者“私有”資源。這些資源包含CPU負載、記憶體使用率、交換分割槽使用率、當前登入使用者數、磁碟使用率、程式狀態等:

 

 

 

間接檢查

 

也可以通過NRPE間接的檢測監控主機不能夠直接監控的遠端Linux/Unix主機上"public" 服務和資源。比如,如果安裝有NRPENagios外掛的遠端主機可以與遠端的web伺服器“談話”,但是監控主機不能夠和遠端的web伺服器“談話”,那麼可以配置遠端Linux/Unix主機上NRPE守護程式監控遠端的web伺服器,這樣便間接的實現了Nagios對遠端web服務的監控:

 

  

 

 

    在這種情況下,遠端Linux/Unix主機上的NRPE守護程式起到了代理的作用。

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/27043155/viewspace-732183/,如需轉載,請註明出處,否則將追究法律責任。

相關文章