报警简单来说就是无人监控的时候系统自己监控相关信息,达到某个值就向技术人员发警报,让技术人员知道发生了什么,能及时处理。比如某天,某个系统的硬盘存满了,没有人在旁边,不知道发生了什么 ,zabbix就报警发送邮件告知技术人员,硬盘满了快来处理。
报警的实现很简单就是用触发器和动作实现的,可以用邮件,那自然要有几个邮件了。
各个选项的含义
首先自定义监控项和模板
这些是我添加的全部监控项
然后添加触发器。
警告的级别,出发规则如上,这个监控项是硬盘使用量。
使用量达到85% 时报警,警告级别。
然后添加动作和报警媒介。
选择邮件 形式。
这里的密码填写的是授权码。
邮箱我用的是163邮箱。
163邮箱要开启这些功能。
其中会用到授权码,现在用什么注册都要授权码。
授权码要记住,是写在zabbix媒介的密码中的。
注意:此时填写的邮件是发
邮件的那一方。
然后添加收邮件的那一方。
在这里添加收
件的人。
然后配置动作。
动作就是触发器被触发后做的操作。
名称可以自定义,条件一般选非维护,级别选择警告,因为触发器那里就是警告嘛,对应的。后边就是触发器了。
注意:其中的 级别建议用等于,如果用大于等于或者小于等于的话,同一个问题可能会发送多条邮件。
然后添加邮件动作。
下边的选项就是:
步骤1,触发器触发后做的第一个操作。
类型:报警的方式
发送到用户:选择发给哪个用户。
这个用户里就有我们刚刚配置的邮件接收人。
这就是报警动作。
步骤那里可以多级报警,比如报警后,第一个人接收到了,立刻处理,处理完成。那么步骤二就不做了,如果到一段时间第一个人还没有解决,那么可以认为事情很难,要多个人解决,然后给第二个人发邮件,也就是执行步骤二。报警升级。
这个是完成后邮件,就是事情解决了发邮件告知大家。
=====
下面就来实际测试下,让触发器被满足。
让它使用量达到5就报警。
{resource:vfs.fs.size[/,pused].last(#1)}>5
然后可以在这里可以看到报警信息。
有一个问题,这个主机这个问题。
同时可以看这里。
动作已经完成了,我们设置的动作就是发邮件,就证明邮件已经发出了。
登录邮箱查看。
能看到邮件,发件人是媒介,收件人是用户里添加的那个。
注意:动作里那个标题和内容就是邮件的标题和正文,这个内容是可以改的,按照自己的需求自定义,要用的东西就是宏
,可以理解成变量
,变量会在邮件中打印那些具体的内容。
出现问题就要解决,因为是测试,所以我就再次修改触发器,改回85报警。
就算是解决了。
解决了。
然后会收到另一封邮件,告诉你事情已经解决了。
报警的方式有很多,我用的是邮件,比较简单,还有短信,电话等等的。
注意:当zabbix监控CPU是要特殊对待,CPU的使用量忽高忽低,运行程序是可能会达到90%但程序结束后又会降回到0%所以要稳定时间