[TroubleShootting]Zabbix數據採集出現斷點的問題
背景
最近發現公司的Zabbix監控大屏上的監控圖經常出現數據斷點的現象,主要集中在一些自定義的監控項數據上,如下圖:
原因
查看Zabbix Server日誌以及zabbix官方手冊後,分析可能原因如下:
- zabbix-server監控的主機太多了;
- 監控項數據採集方式為zabbix被動採集。
由於公司目前監控的主機總共為十幾台,數量並不多當,所以可能是由於被動採集數據導致的。
Zabbix被動採集與主動採集
- 主動採集:把agent主動將數據發送給zabbix server這種方式採集數據,叫做主動監控;
- 被動採集:把zabbix server 向zabbix agent獲取數據的方式叫做被動監控
區別
被動監控只有zabbix server周期性的請求zabbix agent,zabbix agent才會響應對應的數據給zabbix server ,如果zabbix server 不請求,則zabbix agent不會發送數據給zabbix server ;而主動監控不管zabbix server請不請求agent,agent它都會以指定時間頻率向server推送數據;默認zabbix 是使用的被動監控,這也意味著zabbix server 要不停的去請求各zabbix agent去採集數據,否則就沒有數據;
解決方案–將監控項修改為主動監控
Zabbix-agent配置
vim /etc/zabbix/zabbix.agent.conf
LogFile=/tmp/zabbix_agentd.log
Server=192.168.1.2
ServerActive=192.168.1.2
Hostname=dev
RefreshActiveChecks=60
BufferSize=10000
MaxLinesPerSecond=200
Timeout=30
比較重要的參數是ServerActive和Hostname,ServerActive是指定Agentd收集的數據往哪裡發送,Hostname是必須要和Server端添加主機時的主機名對應起來,這樣Server端接收到數據才能找到對應關係,我這裡為了兼容被動模式,沒有把StartAgents設為0,如果一開始就是使用主動模式的話建議把StartAgents設為0,關閉被動模式
修改後需要重啟zabbix-agent:
systemctl restart zabbix-agent.service
zabbix web端配置
調整模板:將模板上的監控項全選,點擊最下方的批量修改,將類型選擇為Zabbix客戶端(主動式)
,如下:
調整完成後最好將所有的監控項先禁用再啟用,防止配置未生效!!!
調整後的效果
經過以上的調整,目前zabbix監控大屏上的數據未出現斷點: