[TroubleShootting]Zabbix資料採集出現斷點的問題

大碗油潑發表於2020-11-28

背景

最近發現公司的Zabbix監控大屏上的監控圖經常出現資料斷點的現象,主要集中在一些自定義的監控項資料上,如下圖:

原因

檢視Zabbix Server日誌以及zabbix官方手冊後,分析可能原因如下:

  • zabbix-server監控的主機太多了;
  • 監控項資料採集方式為zabbix被動採集。

由於公司目前監控的主機總共為十幾臺,數量並不多當,所以可能是由於被動採集資料導致的。

Zabbix被動採集與主動採集

  • 主動採集:把agent主動將資料傳送給zabbix server這種方式採集資料,叫做主動監控;
  • 被動採集:把zabbix server 向zabbix agent獲取資料的方式叫做被動監控

區別

被動監控只有zabbix server週期性的請求zabbix agent,zabbix agent才會響應對應的資料給zabbix server ,如果zabbix server 不請求,則zabbix agent不會傳送資料給zabbix server ;而主動監控不管zabbix server請不請求agent,agent它都會以指定時間頻率向server推送資料;預設zabbix 是使用的被動監控,這也意味著zabbix server 要不停的去請求各zabbix agent去採集資料,否則就沒有資料;

解決方案--將監控項修改為主動監控

Zabbix-agent配置

vim /etc/zabbix/zabbix.agent.conf
LogFile=/tmp/zabbix_agentd.log
Server=192.168.1.2
ServerActive=192.168.1.2
Hostname=dev
RefreshActiveChecks=60
BufferSize=10000
MaxLinesPerSecond=200
Timeout=30

比較重要的引數是ServerActive和Hostname,ServerActive是指定Agentd收集的資料往哪裡傳送,Hostname是必須要和Server端新增主機時的主機名對應起來,這樣Server端接收到資料才能找到對應關係,我這裡為了相容被動模式,沒有把StartAgents設為0,如果一開始就是使用主動模式的話建議把StartAgents設為0,關閉被動模式

修改後需要重啟zabbix-agent:

systemctl restart zabbix-agent.service

zabbix web端配置

調整模板:將模板上的監控項全選,點選最下方的批量修改,將型別選擇為Zabbix客戶端(主動式),如下:

調整完成後最好將所有的監控項先禁用再啟用,防止配置未生效!!!

調整後的效果

經過以上的調整,目前zabbix監控大屏上的資料未出現斷點:

相關文章