背景
最近發現公司的Zabbix監控大屏上的監控圖經常出現資料斷點的現象,主要集中在一些自定義的監控項資料上,如下圖:
原因
檢視Zabbix Server日誌以及zabbix官方手冊後,分析可能原因如下:
- zabbix-server監控的主機太多了;
- 監控項資料採集方式為zabbix被動採集。
由於公司目前監控的主機總共為十幾臺,數量並不多當,所以可能是由於被動採集資料導致的。
Zabbix被動採集與主動採集
- 主動採集:把agent主動將資料傳送給zabbix server這種方式採集資料,叫做主動監控;
- 被動採集:把zabbix server 向zabbix agent獲取資料的方式叫做被動監控
區別
被動監控只有zabbix server週期性的請求zabbix agent,zabbix agent才會響應對應的資料給zabbix server ,如果zabbix server 不請求,則zabbix agent不會傳送資料給zabbix server ;而主動監控不管zabbix server請不請求agent,agent它都會以指定時間頻率向server推送資料;預設zabbix 是使用的被動監控,這也意味著zabbix server 要不停的去請求各zabbix agent去採集資料,否則就沒有資料;
解決方案--將監控項修改為主動監控
Zabbix-agent配置
vim /etc/zabbix/zabbix.agent.conf
LogFile=/tmp/zabbix_agentd.log
Server=192.168.1.2
ServerActive=192.168.1.2
Hostname=dev
RefreshActiveChecks=60
BufferSize=10000
MaxLinesPerSecond=200
Timeout=30
比較重要的引數是ServerActive和Hostname,ServerActive是指定Agentd收集的資料往哪裡傳送,Hostname是必須要和Server端新增主機時的主機名對應起來,這樣Server端接收到資料才能找到對應關係,我這裡為了相容被動模式,沒有把StartAgents設為0,如果一開始就是使用主動模式的話建議把StartAgents設為0,關閉被動模式
修改後需要重啟zabbix-agent:
systemctl restart zabbix-agent.service
zabbix web端配置
調整模板:將模板上的監控項全選,點選最下方的批量修改,將型別選擇為Zabbix客戶端(主動式)
,如下:
調整完成後最好將所有的監控項先禁用再啟用,防止配置未生效!!!
調整後的效果
經過以上的調整,目前zabbix監控大屏上的資料未出現斷點: