文章目录
- 一.zabbix基本概述(理论)
- 1.监控作用
- 2.监控实施
- 3.流行的监控工具
- 4.如何监控
- 4.1监控内容
- 4.2 监控命令
- 4.3 监控情况
- 二.zabbix 监控快速安装(实操)
- 1.配置zabbix仓库
- 2.安装 Zabbix 程序包,以及 MySQL、 Zabbix-agent
- 3.创建 Zabbix 数据库以及用户
- 4.导入 Zabbix 数据至数据库中
- 5.编辑/etc/zabbix/zabbix_server.conf 文件,修改数据库配置
- 6.启动 Zabbix 服务进程,并加入开机自启
- 7.配置 Apache 的配置文件/etc/httpd/conf.d/zabbix.conf,修改时区
- 8.重启 Apache Web 服务器
- 三.WEB安装步骤
- 四.Zabbix 监控基础架构
- 五.zabbix 快速监控主机
- 六.自定义监控主机
- 1.监控需求
- 2.server端进行测试
- 3.web端添加监控项
- 4.克隆监控项
- 5.设置触发器
- 6.创建图形
- 7.设置聚合图形
- 8.添加模板
- 9.应用模板
- 七.邮件报警
- 1.配置
- 2.验证
- 3.自定义报警内容为中文
一.zabbix基本概述(理论)
1.监控作用
1.对系统不间断实时监控
2.实时反馈系统当前状态
3.保证服务可靠性安全性
4.保证业务持续稳定运行
2.监控实施
比如我们需要监控磁盘的使用率
1.如何查看磁盘使用率 df -h
2.监控磁盘的那些指标 block、 inode
3.如何获取具体的信息 df -h|awk '//{ print(NF-1) }'
4.获取的数值到达多少报警 80%
3.流行的监控工具
1.Zabbix
2.Lepus(天兔)数据库监控系统
3.Open-Falcon 小米
4.Prometheus(普罗米修斯, Docker、 K8s)
4.如何监控
4.1监控内容
1.硬件监控 路由器、交换机、防火墙
2.系统监控 CPU、内存、磁盘、网络、进程、 TCP
3.服务监控 nginx、 php、 tomcat、 redis、 memcache、 mysql
4.WEB 监控 请求时间、响应时间、加载时间、
5.日志监控 ELk(收集、存储、分析、展示)
6.安全监控 Firewalld、 WAF(Nginx+lua)、安全宝、牛盾云、安全狗
7.网络监控 smokeping 多机房
8.业务监控 活动引入多少流量、产生多少注册量、带来多大价值
4.2 监控命令
1.CPU 监控命令: w、 top、 htop、 glances
%Cpu(s): 0.3 us, 0.3 sy, 0.0 ni, 99.3 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
us 用户态: 跟用户的操作有关 35%
sy 系统态: 跟内核的处理有关 60%
id CPU 空闲:
2.内存监控命令: free
[root@m01 ~]# free -h
total used free shared buff/cache available
Mem: 977M 105M 724M 6.6M 148M 729M
Swap: 1.0G 0B 1.0G
3.磁盘监控命令: df、 iotop
Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sda 0.80 25.32 33.36 221034 291193
设备名 每秒传输次数 每秒读大小 每秒写大小 读的总大小 写的总大小
4.网络监控命令: ifconfig、 route、 glances、 iftop、 nethogs、 netstat
单位换算
Mbps 100Mbps/8
MB 12MB
iftop 中间的<= =>这两个左右箭头,表示的是流量的方向。
TX:发送流量、 RX:接收流量、 TOTAL:总流量
#查看 TCP11种 状态
netstat -an|grep ESTABLISHED
netstat -rn # 查看路由信息
netstat -lntup
4.3 监控情况
1.随着时间的推移,用户不断的增多,服务随时可能扛不住会被 oom(out of memory),当系统内存不足的时候,会
触发 oom
1)当系统内存不足的时候就会大量使用 swap
2)当系统大量使用 swap 的时候,系统会特别卡
注意: 有时可能内存还有剩余 300Mb-500Mb,但会发现 swap 依然被使用
[root@ZabbixServer ~]# dd if=/dev/zero of=/dev/null bs=800M
[root@ZabbixServer ~]# tail -f /var/log/messages
Out of memory: Kill process 2227 (dd) score 778 or sacrifice child
Killed process 2227 (dd) total-vm:906724kB, anon-rss:798820kB, file-rss:0kB
2.那单机时代,如何使用 shell 脚本来实现服务器的监控
需求: 每隔 1 分钟监控一次内存,当你的可用内存低于 100m,发邮件报警,要求显示剩余内存
1.怎么获取内存可用的值 free -m|awk '/^Mem/{print $NF}'
2.获取到内存可用的值如何和设定的阈值进行比较
3.比较如果大于 100m 则不处理,如果小于 100 则报警
4.如何每隔 1 分钟执行一次
[root@ZabbixServer ~]# cat free.sh
#!/usr/bin/bash
HostName=$(hostname)_$(hostname -i)
Date=$(date +%F)
while true;do
Free=$(free -m|awk '/^Mem/{print $NF}')
if [ $Free -le 100 ];then
echo "$Date: $HostName Mem Is < ${Free}MB"
fi
sleep 5
done
二.zabbix 监控快速安装(实操)
1.配置zabbix仓库
[root@m01 ~]# rpm -ivh https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-release-4.0-1.el7.noarch.rpm
[root@m01 ~]# sed -i 's#repo.zabbix.com#mirrors.tuna.tsinghua.edu.cn/zabbix#g' /etc/yum.repos.d/zabbix.repo
2.安装 Zabbix 程序包,以及 MySQL、 Zabbix-agent
[root@m01 ~]# yum install -y zabbix-server-mysql zabbix-web-mysql zabbix-agent mariadb-server
[root@m01 ~]# systemctl start mariadb.service && systemctl enable mariadb.service
3.创建 Zabbix 数据库以及用户
优化:[root@m01 ~]# mysql_secure_installation
设置这一步,其他都是回车
Set root password? [Y/n] y
New password:
Re-enter new password:
[root@m01 ~]# mysqladmin password 123456(这一步用了安全优化后可以不用)
[root@m01 ~]# mysql -uroot -p123456
MariaDB [(none)]> create database zabbix character set utf8 collate utf8_bin;
MariaDB [(none)]> grant all privileges on zabbix.* to zabbix@localhost identified by 'zabbix';
MariaDB [(none)]> flush privileges;
4.导入 Zabbix 数据至数据库中
[root@m01 ~]# cd /usr/share/doc/
[root@m01 doc]# ll
drwxr-xr-x 2 root root 100 Jul 6 10:05 zabbix-server-mysql-4.0.22
下面的版本要跟上面查出来的对应
[root@m01 ~]# zcat /usr/share/doc/zabbix-server-mysql-4.0.22/create.sql.gz | mysql -uzabbix -pzabbix zabbix
5.编辑/etc/zabbix/zabbix_server.conf 文件,修改数据库配置
[root@m01 ~]# vim /etc/zabbix/zabbix_server.conf
...............
修改这几行:
DBHost=localhost
DBName=zabbix
DBUser=zabbix
DBPassword=zabbix
...............
6.启动 Zabbix 服务进程,并加入开机自启
[root@m01 ~]# systemctl start zabbix-server.service
[root@m01 ~]# systemctl enable zabbix-server.service
7.配置 Apache 的配置文件/etc/httpd/conf.d/zabbix.conf,修改时区
[root@m01 ~]# vim /etc/httpd/conf.d/zabbix.conf
修改这一行:
php_value date.timezone Asia/Shanghai
8.重启 Apache Web 服务器
[root@m01 ~]# systemctl start httpd
三.WEB安装步骤
1.浏览器打开地址:http://10.0.0.61/zabbix/setup.php
2.检查依赖项是否存在异常
3.配置zabbix连接数据库
4.配置 ZabbixServer 服务器的信息
5.最终确认检查
6.安装成功
提示已成功地安装了 Zabbix 前端。配置文件/etc/zabbix/web/zabbix.conf.php 被创建。
7.登陆zabbix
默认登陆 ZabbixWeb 的用户名 Admin,密码 zabbix
8.调整字符集为中文
9.修复中文乱码
打开图形之后会发现语言为乱码,原因是缺少字体
解决方法:安装字体并替换现有字体
[root@m01 ~]# yum install wqy-microhei-fonts -y
[root@m01 ~]# cp /usr/share/fonts/wqy-microhei/wqy-microhei.ttc /usr/share/zabbix/assets/fonts/graphfont.ttf再次刷新发现已经变成中文了
四.Zabbix 监控基础架构
zabbix-agent(数据采集)—>zabbix-server(数据分析|报警)—> 数据库(数据存储)<—zabbix web(数据展示)
五.zabbix 快速监控主机
在agent端操作:
1.安装zabbix-agent
[root@web01 ~]# cat /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
10.0.0.61 m01
10.0.0.7 web01
[root@web01 ~]# rpm -ivh https://mirror.tuna.tsinghua.edu.cn/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-agent-4.0.11-1.el7.x86_64.rpm
2.配置zabbix-agent
[root@web01 ~]# >/etc/zabbix/zabbix_agentd.conf
[root@web01 ~]# grep "^[a-Z]" /etc/zabbix/zabbix_agentd.conf
PidFile=/var/run/zabbix/zabbix_agentd.pid
LogFile=/var/log/zabbix/zabbix_agentd.log
LogFileSize=0
Server=10.0.0.61
ServerActive=10.0.0.61
Hostname=web01
Include=/etc/zabbix/zabbix_agentd.d/*.conf
3.启动zabbix-agent并检查
[root@web01 ~]# systemctl start zabbix-agent.service
[root@web01 ~]# systemctl enable zabbix-agent.service
[root@web01 ~]# netstat -lntup|grep 10050
tcp 0 0 0.0.0.0:10050 0.0.0.0:* LISTEN 10351/zabbix_agentd
tcp6 0 0 :::10050 :::* LISTEN 10351/zabbix_agentd
在server端操作:
[root@m01 ~]# cat /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
10.0.0.61 m01
10.0.0.7 web01
[root@m01 ~]# rpm -ivh https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-release-4.0-1.el7.noarch.rpm
[root@m01 ~]# yum install zabbix-get.x86_64 -y
[root@m01 ~]# systemctl restart zabbix-agent.service
[root@m01 ~]# zabbix_get -s 10.0.0.7 -k agent.hostname
web01(表明服务端和客户端的通信没有问题)
4.zabbix-web界面,添加主机
添加模板
添加成功:
六.自定义监控主机
实验环境:
zabbix-server: 主机名:m01 ip地址:10.0.0.61
zabbix-agent : 主机名:web01 ip地址:10.0.0.7
zabbix-agent : 主机名:web02 ip地址:10.0.0.8
1.监控需求
监控TCP11种状态集
[root@web01 ~]# cd /etc/zabbix/zabbix_agentd.d/
[root@web01 zabbix_agentd.d]# vim tcp_status.conf
UserParameter=TIME_WAIT,netstat -ant|awk 'NR>2{print $6}'|grep "TIME_WAIT"|wc -l
UserParameter=LISTEN,netstat -ant|awk 'NR>2{print $6}'|grep "LISTEN"|wc -l
UserParameter=ESTABLISHED,netstat -ant|awk 'NR>2{print $6}'|grep "ESTABLISHED"|wc -l
[root@web01 zabbix_agentd.d]# systemctl restart zabbix-agent.service
2.server端进行测试
在服务端:
[root@m01 ~]# zabbix_get -s 10.0.0.7 -k TIME_WAIT
40
[root@m01 ~]# zabbix_get -s 10.0.0.7 -k LISTEN
8
[root@m01 ~]# zabbix_get -s 10.0.0.7 -k ESTABLISHED
2
3.web端添加监控项
4.克隆监控项
由于TCP有多种状态,需要添加多个监控项,我们可以使用克隆快速达到创建的效果
监控项设置成功
5.设置触发器
监控项添加成功
6.创建图形
查看图形
7.设置聚合图形
再添加一个聚合图形
添加成功
添加4个页面成功
8.添加模板
添加一台机子10.0.0.8,配置同10.0.0.7
9.应用模板
七.邮件报警
1.配置
授权码的获取:
打开qq邮箱:
2.验证
收到报警信息
报警恢复
3.自定义报警内容为中文
发送警告
报警邮件标题可以使用默认信息,亦可使用如下中文报警内容
名称:Action-Email
默认标题:故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生: {TRIGGER.NAME}故障!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}
恢复标题:恢复{TRIGGER.STATUS}, 服务器:{HOSTNAME1}: {TRIGGER.NAME}已恢复!
恢复信息:
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}
使邮件是中文形式
验证:
恢复