分散式centreon後,新增完poller之後centreon中檢視poller狀態始終為非執行狀態

Michael_DD發表於2014-09-12

故障現象:

做了分散式centreon後,新增完poller之後centreon中檢視poller狀態始終為非執行狀態

 

故障原因:

新增poller時在ndomod.cfg檔案新增錯誤,將output的IP新增為poller自身的IP,該output是資料要發往的地方,在分散式環境中應該設定為遠端核心節點的IP

 

處理過程:

查詢資料說是 nagios目錄的許可權問題(http://bbs.chinaunix.net/thread-1689485-1-1.html),也有其他比如說重啟ndo2db服務問題(http://blog.csdn.net/jack161641/article/details/6876464)

但是都沒有解決我的故障

 

只能自己摸索,這就有一條一定要注意,多看日誌+檔案

 

在日誌裡找到題目中的‘ndomod: Could not open data sink!’這一條時,才意識到問題所在

 
另外一種原因,/usr/local/nagios/etc  下的配置檔案web端重啟後無法更新。

因為是原來的配置檔案,所以把原來的配置檔案刪除一次既可。


[root@nagios_app1]# cd /usr/loca/nagios/etc
[root@nagios_app1 etc]# ll
total 168
-rw-r--r-- 1 centreon centreon  1806 Jun  4 14:42 centreon.conf
-rw-rw-r-- 1 nagios   nagios    1827 Jun  4 14:42 cgi.cfg
-rwxrwxr-x 1 nagios   nagios    1825 Jun  2 19:05 cgi.cfg~
-rw-rw-r-- 1 apache   apache   11357 Jun  4 09:49 checkcommands.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 connectors.cfg
-rw-rw-r-- 1 apache   apache    1383 Jun  4 09:49 contactgroups.cfg
-rw-rw-r-- 1 apache   apache    2744 Jun  4 09:49 contacts.cfg
-rw-rw-r-- 1 apache   apache    1509 Jun  4 09:49 contactTemplates.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 dependencies.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 escalations.cfg
-rw-rw-r-- 1 apache   apache    1211 Jun  4 09:49 hostgroups.cfg
-rw-rw-r-- 1 apache   apache    1575 Jun  4 09:49 hosts.cfg
-rw-rw-r-- 1 apache   apache    2949 Jun  4 09:49 hostTemplates.cfg
-rw-r--r-- 1 root     root        26 Jun  3 14:32 htpasswd.users
-rw-rw-r-- 1 apache   apache    1573 Jun  4 09:49 meta_commands.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 meta_contact.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 meta_contactgroup.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 meta_dependencies.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 meta_escalations.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 meta_host.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 meta_hostgroup.cfg
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 meta_services.cfg
-rw-rw-r-- 1 apache   apache    1341 Jun  4 09:49 meta_timeperiod.cfg
-rw-rw-r-- 1 apache   apache    3779 Jun  4 09:49 misccommands.cfg
-rw-rw-r-- 1 nagios   nagios    3718 Jun  4 14:42 nagios.cfg
-rwxrwxr-x 1 nagios   nagios    4146 Jun  2 19:05 nagios.cfg~
-rw-rw-r-- 1 centreon centreon  3019 Jun  4 14:42 nagiosCFG.DEBUG
-rw-rw-r-- 1 apache   apache    1448 Jun  4 09:49 ndo2db.cfg
-rw-rw-r-- 1 apache   apache    1351 Jun  4 09:49 ndomod.cfg
-rw-r--r-- 1 nagios   nagios    8002 Jun  3 23:04 nrpe.cfg
drwxrwxr-x 2 nagios   nagios    4096 Jun  2 19:07 objects
-rw-rw---- 1 nagios   nagios    1158 Jun  4 14:42 resource.cfg
-rwxrwxr-x 1 nagios   nagios    1158 Jun  2 19:05 resource.cfg~
-rw-rw-r-- 1 apache   apache    1089 Jun  4 09:49 servicegroups.cfg
-rw-rw-r-- 1 apache   apache    2271 Jun  4 09:49 services.cfg
-rw-rw-r-- 1 apache   apache    5799 Jun  4 09:49 serviceTemplates.cfg
-rw-rw-r-- 1 apache   apache    2138 Jun  4 09:49 timeperiods.cfg
[root@nagios_app1 etc]# rm -rf *.cfg


我的環境是做的分散式的centreon,結果在web介面配置poller節點時配置有誤,導致上述原因

檢視poller伺服器上的ndomod.cfg檔案,發現其中output變數為本地IP,結合無法連線至ndo2db,判斷該IP應該為遠端核心節點的IP

 

(分散式centreon中只在核心節點上起ndo2db,開放5668埠,各地poller透過該和遠端DB互動存取監控資料 而ndomod.cfg就是指定本機poller所要連線的遠端核心節點的資訊,包括遠端核心的IP,通訊埠5668等其他設定)

 

其實歸結問題根源是對整體架構不熟悉,尤其幾個關鍵配置檔案裡的引數含義

 

ndomod.cfg:在poller上,就是指定本機poller所要連線的遠端核心節點的資訊,包括遠端核心的IP,通訊埠5668等其他設定

ndo2db.cfg這個只在核心節點上有,是和後臺打交道的傳話人,裡面需要配置 DB的相關資訊

nagios.cfg:這是nagios程式的主要配置檔案,poller基本就等價於nagios的作用,(poller==nagios+ndoutils)

ndoutils:是為了將nagios資料處理後能寫入資料庫的模組


這有個圖幫助理解:

 

 

分散式centreon部署過程:

參考http://bluemood.blog.51cto.com/1142811/958523

核心節點需要安裝centreon,資料庫

衛星節點需要安裝nagios+ndoutils

剩下步驟主要在核心上完成,簡單講分為:

#1 建立到poller的信任

ssh-copy-id -i ~/.ssh/id_rsa.pub nagios@x.x.x.x

 

#2 copy plugins複製配置和外掛檔案

scp /usr/lib64/nagios/plugins/* nagios@x.x.x.x:/usr/lib64/nagios/plugins/

 

## copy conf of nagios

scp /etc/nagios/* nagios@x.x.x.x :/etc/nagios/

 

##3 web介面新增節點即可,add poller src="" border="0" />v

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29500582/viewspace-1268650/,如需轉載,請註明出處,否則將追究法律責任。

相關文章