分散式centreon後,新增完poller之後centreon中檢視poller狀態始終為非執行狀態
故障現象:
做了分散式centreon後,新增完poller之後centreon中檢視poller狀態始終為非執行狀態
故障原因:
新增poller時在ndomod.cfg檔案新增錯誤,將output的IP新增為poller自身的IP,該output是資料要發往的地方,在分散式環境中應該設定為遠端核心節點的IP
處理過程:
查詢資料說是 nagios目錄的許可權問題(http://bbs.chinaunix.net/thread-1689485-1-1.html),也有其他比如說重啟ndo2db服務問題(http://blog.csdn.net/jack161641/article/details/6876464)
但是都沒有解決我的故障
只能自己摸索,這就有一條一定要注意,多看日誌+檔案
在日誌裡找到題目中的‘ndomod: Could not open data sink!’這一條時,才意識到問題所在
另外一種原因,/usr/local/nagios/etc 下的配置檔案web端重啟後無法更新。
因為是原來的配置檔案,所以把原來的配置檔案刪除一次既可。
[root@nagios_app1]# cd /usr/loca/nagios/etc
[root@nagios_app1 etc]# ll
total 168
-rw-r--r-- 1 centreon centreon 1806 Jun 4 14:42 centreon.conf
-rw-rw-r-- 1 nagios nagios 1827 Jun 4 14:42 cgi.cfg
-rwxrwxr-x 1 nagios nagios 1825 Jun 2 19:05 cgi.cfg~
-rw-rw-r-- 1 apache apache 11357 Jun 4 09:49 checkcommands.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 connectors.cfg
-rw-rw-r-- 1 apache apache 1383 Jun 4 09:49 contactgroups.cfg
-rw-rw-r-- 1 apache apache 2744 Jun 4 09:49 contacts.cfg
-rw-rw-r-- 1 apache apache 1509 Jun 4 09:49 contactTemplates.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 dependencies.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 escalations.cfg
-rw-rw-r-- 1 apache apache 1211 Jun 4 09:49 hostgroups.cfg
-rw-rw-r-- 1 apache apache 1575 Jun 4 09:49 hosts.cfg
-rw-rw-r-- 1 apache apache 2949 Jun 4 09:49 hostTemplates.cfg
-rw-r--r-- 1 root root 26 Jun 3 14:32 htpasswd.users
-rw-rw-r-- 1 apache apache 1573 Jun 4 09:49 meta_commands.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 meta_contact.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 meta_contactgroup.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 meta_dependencies.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 meta_escalations.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 meta_host.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 meta_hostgroup.cfg
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 meta_services.cfg
-rw-rw-r-- 1 apache apache 1341 Jun 4 09:49 meta_timeperiod.cfg
-rw-rw-r-- 1 apache apache 3779 Jun 4 09:49 misccommands.cfg
-rw-rw-r-- 1 nagios nagios 3718 Jun 4 14:42 nagios.cfg
-rwxrwxr-x 1 nagios nagios 4146 Jun 2 19:05 nagios.cfg~
-rw-rw-r-- 1 centreon centreon 3019 Jun 4 14:42 nagiosCFG.DEBUG
-rw-rw-r-- 1 apache apache 1448 Jun 4 09:49 ndo2db.cfg
-rw-rw-r-- 1 apache apache 1351 Jun 4 09:49 ndomod.cfg
-rw-r--r-- 1 nagios nagios 8002 Jun 3 23:04 nrpe.cfg
drwxrwxr-x 2 nagios nagios 4096 Jun 2 19:07 objects
-rw-rw---- 1 nagios nagios 1158 Jun 4 14:42 resource.cfg
-rwxrwxr-x 1 nagios nagios 1158 Jun 2 19:05 resource.cfg~
-rw-rw-r-- 1 apache apache 1089 Jun 4 09:49 servicegroups.cfg
-rw-rw-r-- 1 apache apache 2271 Jun 4 09:49 services.cfg
-rw-rw-r-- 1 apache apache 5799 Jun 4 09:49 serviceTemplates.cfg
-rw-rw-r-- 1 apache apache 2138 Jun 4 09:49 timeperiods.cfg
[root@nagios_app1 etc]# rm -rf *.cfg
我的環境是做的分散式的centreon,結果在web介面配置poller節點時配置有誤,導致上述原因
檢視poller伺服器上的ndomod.cfg檔案,發現其中output變數為本地IP,結合無法連線至ndo2db,判斷該IP應該為遠端核心節點的IP
(分散式centreon中只在核心節點上起ndo2db,開放5668埠,各地poller透過該和遠端DB互動存取監控資料 而ndomod.cfg就是指定本機poller所要連線的遠端核心節點的資訊,包括遠端核心的IP,通訊埠5668等其他設定)
其實歸結問題根源是對整體架構不熟悉,尤其幾個關鍵配置檔案裡的引數含義
ndomod.cfg:在poller上,就是指定本機poller所要連線的遠端核心節點的資訊,包括遠端核心的IP,通訊埠5668等其他設定
ndo2db.cfg:這個只在核心節點上有,是和後臺打交道的傳話人,裡面需要配置 DB的相關資訊
nagios.cfg:這是nagios程式的主要配置檔案,poller基本就等價於nagios的作用,(poller==nagios+ndoutils)
ndoutils:是為了將nagios資料處理後能寫入資料庫的模組
這有個圖幫助理解:
分散式centreon部署過程:
參考http://bluemood.blog.51cto.com/1142811/958523
核心節點需要安裝centreon,資料庫
衛星節點需要安裝nagios+ndoutils
剩下步驟主要在核心上完成,簡單講分為:
#1 建立到poller的信任
ssh-copy-id -i ~/.ssh/id_rsa.pub nagios@x.x.x.x
#2 copy plugins複製配置和外掛檔案
scp /usr/lib64/nagios/plugins/* nagios@x.x.x.x:/usr/lib64/nagios/plugins/
## copy conf of nagios
scp /etc/nagios/* nagios@x.x.x.x :/etc/nagios/
##3 在web介面新增節點即可,add poller src="" border="0" />v
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29500582/viewspace-1268650/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Nagios+centreon做分散式後導致centreon_storage資料庫資料重複iOS分散式資料庫
- 請求更改狀態介面後,執行 sql 查出來狀態不對SQL
- 分散式監控報警平臺Centreon之:Centreon依賴安裝薦分散式
- 檢視BW執行狀態
- Solaris之檢視執行系統狀態
- 搭建nagios+centreon分散式iOS分散式
- Docker 之 執行狀態監控Docker
- 執行緒狀態執行緒
- 後端的狀態碼後端
- 使用 telescope 檢視 schedule 執行狀態
- 分散式儲存Ceph之PG狀態詳解分散式
- Java執行緒的狀態Java執行緒
- 執行緒狀態和鎖執行緒
- 執行緒各種狀態執行緒
- 分散式監控平臺Centreon實踐真傳分散式
- 在GI安裝完成後檢視叢集狀態時發現,磁碟組狀態不對
- java執行緒的五大狀態,阻塞狀態詳解Java執行緒
- 行為型模式:狀態模式模式
- Java多執行緒-執行緒狀態Java執行緒
- 檢視mysql執行狀態的一些sqlMySql
- 檢視spark程式執行狀態以及安裝sparkSpark
- 零程式碼儲存視窗執行狀態 (轉)
- 點選按鈕之後將其設定為不可用狀態
- MySQL執行緒狀態詳解MySql執行緒
- Java執行緒狀態轉換Java執行緒
- MySQL MHA 執行狀態監控MySql
- 如何偵查SQL執行狀態SQL
- 執行緒的幾種狀態執行緒
- memcached的執行狀態監控
- java--執行緒狀態【轉】Java執行緒
- Mysql複製執行緒狀態MySql執行緒
- Xcode 檔案後狀態標識XCode
- 玩家——受傷後的保護狀態
- ORACLE VM建立SERVER POOLS後狀態為ERR的解決OracleServer
- 執行緒6--執行緒的狀態執行緒
- 行為和狀態的關係
- 求助!如何追蹤除錯釋出後的EJB的程式執行狀態?除錯
- SAP BSP應用有狀態和無狀態行為差異比較