WGCLOUD分散式監控平臺:導致agent主機下線離線的原因整理
agent主機下線問題,agent日誌列印 防篡改校驗失敗或者 防篡改校驗錯誤次數大於10次,不再上報資料
這個問題注意幾點,按照順序依次排查下
1、 wgcloud的server和agent的主機系統時間差不能大於15個小時,若時間差不超過15小時列印【防篡改校驗錯誤】類似資訊,忽略即可,不會有影響
2、 若是v3.3.5之前版本,server主機的9997埠(這是守護程式wgcloud-daemon-release的預設埠)要開放給agent主機,保證agent主機可以telnet通server的9997埠
若是v3.3.5或以後版本 ,9997埠已經不需要開放給agent主機訪問
3、 修改了守護程式wgcloud-daemon-release的預設埠導致的,server配置檔案和守護程式配置檔案沒有同步修改埠,檢視修改說明
4、若是v3.3.5或之後版本,檢視server本機是否能正常訪問獲得返回值,如:2faa233a1400201bedc199fe1d8ab393,若server主機的localhost不能使用,可以在配置檔案server/config/application.yml,將配置項daemonUrl: 中的localhost改成server主機ip
5、 wgcloud-server-release.jar不要編輯修改,若編輯過,還原到安裝包裡的wgcloud-server-release.jar即可
6、 server和agent要保持同一個版本號
7、server端的守護程式(wgcloud-daemon-release)不要關閉,特別是Windows注意不要關閉守護程式視窗。若是Linux,守護程式可能是被kill了,檢視守護程式是否還存活(ps -ef | grep wgcloud)
還有一種可能是server部署在Windows,不小心左鍵點選守護程式的視窗,進入編輯模式了,右擊恢復就好了
如果此原因導致的話,重啟server(守護程式會隨著server啟動)後,1小時內所有agent會陸續恢復上線,也可以手動重啟agent(立即上線)
8、 server如果執行在arm、龍芯等系統,需要將守護程式wgcloud-agent-release替換為對應的版本,點選下載
9、 如果server或守護程式(wgcloud-daemon-release)長時間沒有啟動執行,那麼當server重新啟動後,agent會在1小時內陸續自動恢復上線,不用重啟agent。也可以手動重啟agent,會立刻恢復上線
10、 可能是agent主機ping不通server主機,或訪問不到server埠,我們可以在agent主機使用ping [server主機IP]和telnet [server主機IP] 9999來測試連通性
11、如果是在docker部署 server,我們檢查下是否把config/application.yml中的守護程式url中的localhost改為宿主機ip了,如下
一般需要改下,除非是docker容器內可以訪問的話,那就可以不改
#守護程式訪問url,server服務使用,agent不使用(一般保持預設即可) daemonUrl:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024568/viewspace-2926700/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- WGCLOUD的服務端server主機也要部署agent監測嗎GCCloud服務端Server
- WGCLOUD監控平臺入門到精通:agent識別的IP不準確,如何處理GCCloud
- 分散式監控平臺Centreon實踐真傳分散式
- WGCLOUD主機監測軟體的指令下發和自定義監控項有什麼區別GCCloud
- zabbix的主動模式監控和zabbix-proxy分散式監控模式分散式
- Zabbix Agent active主動模式監控模式
- Zabbix新增主機監控-zabbix+grafana從零設計自己的監控平臺Grafana
- WGCLOUD監控平臺把光碟機誤認為磁碟併發出告警,解決方法GCCloud
- WGCLOUD連不上是MySQL的原因整理GCCloudMySql
- linux下cacti監控平臺的搭建Linux
- 分散式監控系統之Zabbix主動、被動及web監控分散式Web
- WGCLOUD監控平臺第一個英文版本v3.4.2正式釋出GCCloud
- 開源監控軟體WGCLOUD多久採集一次主機資料GCCloud
- 能耗線上管理平臺搭建能源監控系統開發
- WGCLOUD 叢集監控平臺 v2.1,正式釋出原始碼,支援開源GCCloud原始碼
- 手把手教你搭建高逼格監控平臺,第四彈,監控主機存活狀態
- zabbix監控平臺
- 飛機導航系統遭攻擊!致多架飛機偏離航線
- 印表機離線了怎麼連線 印表機離線的連線方法
- Zabbix監控平臺的搭建
- 能源能源管控系統開發方案,線上監測平臺搭建
- 3-主機監控、應用監控
- 印表機離線如何處理 印表機離線的方法
- 印表機離線了怎麼重新連線 印表機離線重新連線的方法
- linux監控平臺搭建Linux
- 分散式系統監視工具WGCLOUD - 監測docker容器的採集時間間隔分散式GCCloudDocker
- 導致物聯網路卡停機的原因
- 大型企業能源管理監控系統開發,線上監測平臺搭建方案
- Zabbix學習(五)之Zabbix Agent Active 主動模式監控模式
- 【一】從0開始,用flask+mongo打造分散式伺服器監控平臺FlaskGo分散式伺服器
- 筆記本透過網線遠端連線另一臺非聯網臺式主機筆記
- 導致IP被封的原因
- 分散式鎖導致的超賣問題分散式
- Elixir 分散式平臺分散式
- Zabbix企業分散式監控工具分散式
- 總結導致oracle資料庫主機CPU sys%高的一些原因Oracle資料庫
- 分散式架構的監控與指標分散式架構指標
- 使用第三方平臺監控線上專案程式碼錯誤