nagios监控mysql主从同步
在网上看了很多多文章大多出自一个人
,不过有几处错误也不够详细 ,在这自己写详细点。
最近mysql同步老出问题,我做为一个运维第一时间没发现惭愧啊。。。
登入mysql从服务器,通过执行 mysql> show slave status\G 查看其输出,即可判定主从复制是否正常。下面是某个从服务器的输出:
mysql> show slave status\G
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 192.168.93.16
Master_User: rep1
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: mysql-bin.000004
Read_Master_Log_Pos: 1752541
Relay_Log_File: hy-mysql3-relay-bin.000088
Relay_Log_Pos: 2339
Relay_Master_Log_File: mysql-bin.000004
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
这个输出,最关键处就是"Slave_IO_Running: Yes“和“Slave_SQL_Running: Yes”,这两个值全是"Yes"就表明操作步骤:
1、在被监控的从服务器增加一个用户,给予较低的权限,操作为 :
注:Replication client 有此权限可以查询master server、slave server状态。
mysql> flush privileges;
2、验证一下,看是否正常, .
注意:这个操作是在 shell下操作的!!
3、在从服务器安装 nrpe,然后在配置文件nrpe.cfg加入一行
vi /usr/local/nagios/etc/nrpe.cfg
4、编写脚本/usr/local/nagios/libexec/check_mysql_slave(这是监控其作用的核心),其内容如下:
declare -a slave_is
slave_is=($(/usr/local/mysql/bin/mysql -unagios -pnagios -e "show slave status\G"|grep Running |awk '{print $2}'))
if [ "${slave_is[0]}" = "Yes" -a "${slave_is[1]}" = "Yes" ]
then
echo "OK C2-slave is running"
exit 0
else
echo "Critical C2-slave is error"
exit 2
fi
5、手动运行这个脚本,观察输出。
use service
host_name 被监控段的IP 地址必须有nrpe
service_description check_mysql_slave nagios显示的名字
check_command check_nrpe!check_mysql_slave 查找的插件
notification_options w,u,c,r 状态
contact_groups 联系组
}
use host
host_name IP
address IP