zabbix agent检测分为主动(agent active)和被动(agent)两种形式,主动与被动的说法均是相对于agent来讨论的。简单说明一下主动与被动的区别如下:
主动:agent请求server获取主动的监控项列表,并主动将监控项内需要检测的数据提交给server/proxy
被动:server向agent请求获取监控项的数据,agent返回数据
zabbix_server端当主机数量过多的时候,由Server端去收集数据,Zabbix会出现严重的性能问题,主要表现如下:
当被监控端到达一个量级的时候,Web操作很卡,容易出现502
图层断裂
开启的进程(Pollar)太多,即使减少item数量,以后加入一定量的机器也会有问题
所以下面主要往两个优化方向考虑:
添加Proxy节点或者Node模式做分布式监控
调整Agentd为主动模式
由于第一个方案需要增加物理机器,所以首先尝试第二方案
1、设置zabbix agent
Server=10.0.0.63(只允许索要监控项的值得ip地址)
Serveractive=10.0.0.62(如果设置为空或者注释,就代表关闭zabbix agent的主动模式)
[root@web01 ~]# vim /etc/zabbix/zabbix_agentd.conf #修改配置文件
95 Server=192.168.1.63
136 ServerActive=192.168.1.63 #设置主动模式
[root@web01 ~]# systemctl restart zabbix-agent.service
2、server端web界面操作
修改主机的主机名与agent配置文件中Hostname一致
修改全部监控项的类型为zabbix agent(主动模式)
具体步骤为:
2.1 取消链接并清理主机原来链接的模板
2.2 全克隆模板,并更改监控项的类型为客户端主动式
例如全克隆模板Template OS Linux,新的模板名称命名为Template OS Linux-active
2.3 批量更新主动模板的监控项
选择模板Template OS Linux-active,全选监控项,批量更新
更新页面中类型选择zabbix客户端(主动式)
2.4 重新为主机链接主动式模板
3、检查
查看最新数据,数据的获取时间是相同的,说明agent的被动模式配置成功