两台服务器, 已经做好了主主复制, 现再用keepalived保证高可用性.
闲话少说, 先在两台服务器都安装keepalived:
yum install keepalived -y
安装成功.
keepalived默认会使用这个配置文件: /etc/keepalived/keepalived.conf
安装好之后会有一个默认的, 我们可以备份一下, 其实不备份也没事
keepalived.conf 使用以下配置:
[root@master1 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@master1 ~]# vim /etc/keepalived/keepalived.conf #清空默认内容,直接采用下面配置:
! Configuration File for keepalived
global_defs {
router_id mysql1
}
vrrp_script chk_mysql_port { #检测mysql服务是否在运行。有很多方式,比如进程,用脚本检测等等
script "/opt/chk_mysql.sh" #这里通过脚本监测
interval 2 #脚本执行间隔,每2s检测一次
weight -5 #脚本结果导致的优先级变更,检测失败(脚本返回非0)则优先级 -5
fall 2 #检测连续2次失败才算确定是真失败。会用weight减少优先级(1-255之间)
rise 1 #检测1次成功就算成功。但不修改优先级
}
vrrp_instance VI_1 {
state BACKUP
interface enp0s3 #指定虚拟ip的网卡接口
virtual_router_id 100 #路由器标识,MASTER和BACKUP必须是一致的
priority 101 #定义优先级,数字越大,优先级越高,在同一个vrrp_instance下,MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后,就可以将VIP资源再次抢回来
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.1.222 #设置虚拟IP
}
track_script {
chk_mysql_port
}
}
global_defs 是全局配置, 主要用来在这台机器上的mysql挂了之后发邮件通知, 不过这里先不用邮件通知的机制. 主要要配置的是router_id, 其实就是一个标识服务器的id, 两台服务器的这个值要不同
vrrp_script 是配置检查mysql是否正常的脚本, 脚本下面会给出
vrrp_instance 是实例, 需要注意的点:
state配成BACKUP表示可以结合nopreemt设置非抢占式, 就是A上的mysql挂了, 则vip会漂到B上去, 等A上的mysql再好了, vip也还是在B上, 要等到B上的mysql挂了, 才会把vip漂到A上去. 认为这种方式比较合理, 没啥好抢的嘛, 都是为用户服务嘛, 抢啥.
interface要配成当前机器的真实ip使用的那个网卡, 比如有时候是eth0, 但是我看了我服务器上的是enp0s3:
virtual_router_id路由器标识,MASTER和BACKUP必须是一致的.
nopreempt设置成非抢占模式, 这个还是不要用的好, 下面解释.
下面给出第二台机器的keepalived配置:
[root@localhost opt]# cat /etc/keepalived/keepalived.conf
! Configuration File for keepalived
global_defs {
router_id mysql2
}
vrrp_script chk_mysql_port {
script "/opt/chk_mysql.sh"
interval 2
weight -5
fall 2
rise 1
}
vrrp_instance VI_1 {
state BACKUP
interface enp0s3
virtual_router_id 100
priority 97
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.1.222
}
track_script {
chk_mysql_port
}
}
可以看到, 两台机器只有router_id和priority不同. 而且两台都设置成了BACKUP, 没有nopreempt.
/opt/chk_mysql.sh脚本:
#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=c1551
MYSQL_PASSWORD=1qaz@WSX3edc
CHECK_TIME=3
#mysql is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0
MYSQL_OK=1
function check_mysql_helth (){
$MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
if [ $? = 0 ] ;then
MYSQL_OK=1
else
MYSQL_OK=0
fi
echo $MYSQL_OK
return $MYSQL_OK
}
while [ $CHECK_TIME -ne 0 ]
do
let "CHECK_TIME -= 1"
check_mysql_helth
if [ $MYSQL_OK = 1 ] ; then
CHECK_TIME=0
exit 0
fi
if [ $MYSQL_OK -eq 0 ] && [ $CHECK_TIME -eq 0 ]
then
echo 'killing keepalived...'
pkill keepalived
exit 1
else
echo 'not killing keepalived...'
fi
sleep 1
done
对于抢占和非抢占, 有人是这么说的:
keepalive是基于vrrp协议在linux主机上以守护进程方式,根据配置文件实现健康检查。
VRRP是一种选择协议,它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。
控制虚拟路由器IP地址的VRRP路由器称为主路由器,它负责转发数据包到这些虚拟IP地址。
一旦主路由器不可用,这种选择过程就提供了动态的故障转移机制,这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。
keepalive通过组播,单播等方式(自定义),实现keepalive主备推选。工作模式分为抢占和非抢占(通过参数nopreempt来控制)。
1)抢占模式:
主服务正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不提供服务,备提供服务。
也就是说,工作在抢占模式下,不分主备,只管优先级。
如上配置,不管keepalived.conf里的state配置成master还是backup,只看谁的priority优先级高(一般而言,state为MASTER的优先级要高于BACKUP)。
priority优先级高的那一个在故障恢复后,会自动将VIP资源再次抢占回来!!
2)非抢占模式:
这种方式通过参数nopreempt(一般设置在advert_int的那一行下面)来控制。不管priority优先级,只要MASTER机器发生故障,VIP资源就会被切换到BACKUP上。
并且当MASTER机器恢复后,也不会去将VIP资源抢占回来,直至BACKUP机器发生故障时,才能自动切换回来。
千万注意:
nopreempt这个参数只能用于state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式!
也就是说:
a)当state状态一个为master,一个为backup的时候,加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的,是抢占模式!
b)当state状态都设置成backup,如果不配置nopreempt参数,那么也是看priority优先级决定谁抢占vip资源,即也是抢占模式。
c)当state状态都设置成backup,如果配置nopreempt参数,那么就不会去考虑priority优先级了,是非抢占模式!即只有vip当前所在机器发生故障,另一台机器才能接管vip。即使优先级高的那一台机器恢复 后也不会主动抢回vip,只能等到对方发生故障,才会将vip切回来。
然而我发现, 如果我两个都设置成BACKUP而且启用nopreempt, 而且使用上面的健康检查脚本, 那么, 如果一台机器上的mysql挂了, 虽然健康检查没过, 这台机器上keepalived的priority降低了, 但是, vip还是在这台机器上. 因为上面也说了, 并不会主动抢加vip, 只有这台机器上的keepalived挂了或者直接这台机器挂了, vip才会漂到另外一台机器上!!! WTF!!! 就是说这台机器上的mysql虽然挂了, 但这台机器上的keepalived还是在一边等mysql起来, 同时还是占用了vip的!! 这显然不是我想要的. 所以, 还是不配置nopreempt好了, 让priority降低的机器自动释放vip.
以上.