master1和master2公用一个VIP。当某个master宕机后,keepalived能自动将VIP漂移到另一个master上。只需要1~3秒即可切换完成,基本能保证服务不中断。

 

实验环境:

    CentOS6.7X86_64

    MariaDB10.0.17

    Keepalived1.2.21

 

各节点配置:

    Master1:192.168.2.13

    Master2:192.168.2.14

    VIP:192.168.2.100

    Slave:192.168.2.11

    Web服务器:192.168.2.11


主要步骤如下:

构建MySQL双主---> 配置Keepalived ---> 模拟节点故障 ---> MHA基础上构建web站点 ---> MHA基础上添加Slave



一、构建双主MySQL

安装MariaDB过程略过,可以直接使用通用二进制包进行安装。

首先确保2台Master是新安装的(不是新安装的话,执行mysql_install_db重新初始化即可),配置起来更方便些。

 

配置Master1,修改my.cnf,如下:

[mysqld]

....主要修改如下:....

innodb_file_per_table =ON

skip_name_resolve = ON


log-bin=mysql-bin

binlog_format=mixed

server-id=1

log_slave_updates=ON


auto-increment-offset = 1

auto-increment-increment = 2

replicate-ignore-db = test

replicate-ignore-db = mysql

 

配置Master2,修改my.cnf,如下:

[mysqld]

....主要修改如下:....

innodb_file_per_table =ON

skip_name_resolve = ON

 

log-bin=mysql-bin

binlog_format=mixed

server-id=2

log_slave_updates=ON

 

auto-increment-offset = 2

auto-increment-increment = 2

replicate-ignore-db = test

replicate-ignore-db = mysql

 

在Master1上建立授权用户

> grant replication slave on *.* to 'repluser'@'192.168.2.%' identified by '123456';

> flush privileges;

> show master status;

Keepalived+Master-Master-Slave组合_Keepalived+Master-Ma

在Master2上连接到Master1作为自己的主服务器

> change master to master_host='192.168.2.13',

master_user='repluser',

master_password='123456',

master_log_file='mysql-bin.000003',

master_log_pos=22519;

 

> start slave;

> show slave status\G

Keepalived+Master-Master-Slave组合_Keepalived+Master-Ma_02

在Master2上建立授权用户

> grant replication slave on *.* to 'repluser'@'192.168.2.%' identified by '123456';

> flush privileges;

> show master status;

Keepalived+Master-Master-Slave组合_Keepalived+Master-Ma_03

在Master1上连接到Master2作为自己的主服务器

> change master to master_host='192.168.2.14',

master_user='repluser',

master_password='123456',

master_log_file='mysql-bin.000003',

master_log_pos=643;

 

> start slave;

> show slave status\G

Keepalived+Master-Master-Slave组合_Keepalived+Master-Ma_04


二、安装配置keepalived


编译安装keepalived


在2个节点都如下操作:

tar xf keepalived-1.2.21.tar.gz

cd keepalived-1.2.21

./configure

make && make install


cp /usr/local/etc/rc.d/init.d/keepalived /etc/rc.d/init.d


cp /usr/local/etc/sysconfig/keepalived /etc/sysconfig/


mkdir /etc/keepalived


cp /usr/local/etc/keepalived/keepalived.conf /etc/keepalived

cp /usr/local/sbin/keepalived /usr/sbin/


chkconfig --add keepalived

chkconfig keepalived on

 

在master1(192.168.2.13)上,修改keepalived的配置文件,如下:

! Configuration File forkeepalived

 

global_defs {

  notification_email {

       receiver@126.com

  }

  notification_email_from localhost

  smtp_server 127.0.0.1

  smtp_connect_timeout 30

  router_id MySQL_HA

}

 

vrrp_instance VI_1 {

   state BACKUP      # 两台配置此处均是BACKUP 

   interface eth0    # 网卡,可使用ifconfig查看

   virtual_router_id 51

   priority 100       # 优先级,另一台改为90,默认VIP飘在在这个节点上

   advert_int 1

    nopreempt         # 不抢占,只在优先级高的机器上设置即可,优先级低的机器不设置

   authentication {

        auth_type PASS

        auth_pass 1111

   }

   virtual_ipaddress {

        192.168.2.100 dev eth0 label eth0:1

   }

}

 

virtual_server 192.168.2.100 3306{

   delay_loop 2      # 每个2秒检查一次real_server状态 

   lb_algo rr    # 轮询算法

   lb_kind DR    # LVS算法,直接转发

   persistence_timeout 50   # 会话保持时间

   protocol TCP

 

   real_server 192.168.2.13 3306 {     # 只配置一个real_server,且为本机地址

        weight 3

       notify_down/home/scripts/MySQL.sh # 检测到服务down后执行的脚本 

       TCP_CHECK{

           connect_timeout10       # 连接超时时间

           nb_get_retry 3           # 重连次数

           delay_before_retry 3 # 重连间隔时间

           connect_port 3306    # 健康检查端口

        }

   }

}

 

在master2(192.168.2.14)上,修改keepalived的配置文件,如下:

! Configuration File forkeepalived

 

global_defs {

  notification_email {

       receiver@126.com

  }

  notification_email_from localhost

  smtp_server 127.0.0.1

  smtp_connect_timeout 30

  router_id MySQL_HA

}

 

vrrp_instance VI_1 {

   state BACKUP      # 两台配置此处均是BACKUP 

   interface eth0    # 网卡,可使用ifconfig查看

   virtual_router_id 51

   priority 90       # 优先级,master2这台改为90,当master1无响应,则VIP会飘到这个节点

   advert_int 1

    #nopreempt          # 不抢占,只在优先级高的机器上设置即可,优先级低的机器设不设置都无所谓

   authentication {

       auth_type PASS

        auth_pass 1111

   }

   virtual_ipaddress {

        192.168.2.100 dev eth0 label eth0:1

   }

}

 

virtual_server 192.168.2.100 3306{

   delay_loop 2      # 每个2秒检查一次real_server状态 

   lb_algo rr    # 轮询算法

   lb_kind DR    # LVS算法,直接转发

   persistence_timeout 50   # 会话保持时间

   protocol TCP

 

   real_server 192.168.2.14 3306 {     # 只配置一个real_server,且为本机地址

        weight 3

       notify_down/home/scripts/MySQL.sh # 检测到服务down后执行的脚本 

       TCP_CHECK{

           connect_timeout10       # 连接超时时间

           nb_get_retry 3           # 重连次数

           delay_before_retry 3 # 重连间隔时间

           connect_port 3306    # 健康检查端口

        }

   }

}

 

编写检测服务down后所要执行的脚本

在master1和master2都执行下面的操作:

 

mkdir /home/scripts/

vim /home/scripts/MySQL.sh 内容如下


#!/bin/sh

pkill keepalived


注意:

此脚本是上面配置文件notify_down选项所用到的,


keepalived使用notify_down选项来检查real_server的服务状态,当发现real_server服务故障

时,便触发此脚本;我们可以看到,脚本就一个命令,通过pkill keepalived强制杀死

keepalived进程,从而实现了MySQL故障自动转移。



另外,我们不用担心两个MySQL会同时提供数据更新操作,因为每台MySQL上的keepalived的配置里面只有本机MySQL的IP+VIP,而不是两台MySQL的IP+VIP。

 

在master1和master2上都启动keepalived


/etc/init.d/keepalived start


ps aux|grep keepalived


ifconfig -a


可以看到VIP默认是在master1上的(因为keepalived里配置master1的优先级为100,master2的优先级为90)


 

三、模拟节点故障

模拟MySQLMaster的写节点故障

我们可以模拟下master的MySQL无法访问了,看看VIP会不会自动漂移。

先查看master1、master2的IP情况,如下图:

Keepalived+Master-Master-Slave组合_Keepalived+Master-Ma_05


可以看到VIP在master1节点上。我们在master1上执行/etc/init.d/mariadb stop 模拟master1的MySQL进程挂掉的情况。

然后,在maste1和master2上执行


ps aux|egrep "keepalived|mariadb"


ip a

可以看到VIP已经漂移到master2上了。此时,master1上的MariaDB进程挂掉后,keepalived进程也一并被kill了。

 

 

至此,实验初步算是完成了。但是这个方案的话,mysql一退出, keepalived也退出了,后面再次修复的话要手动启动keepalived进程,不然就达不到高可用的效果了。不过出于数据安全性、完整性考虑,MySQL和keepalived进程还是应该手动恢复的。


这个方案还有个不足,就是mysql端口和进程都在,但是复制线程却不是Yes状态了,这种只能靠zabbix

或者其它监控工具来监控了。

 


四、在MHA的基础上构建个web站点

MySQL高可用实现后,不如继续深入下,再基于上面的环境构建个web站点吧,操作如下:

 

web节点参数:

IP:192.168.2.11

运行有:Nginx+php-fpm

 

nginx虚拟主机配置如下:

server {

   listen  80;

   server_name  192.168.2.11;

 

   location / {

        root           /home/wwwroot/default;

        index index.php index.html index.htm;

   }

 

   location ~ \.php$ {

        root           /home/wwwroot/default;

       fastcgi_pass  unix:/tmp/php-cgi.sock;

       fastcgi_index  index.php;

       fastcgi_param  SCRIPT_FILENAME  $document_root$fastcgi_script_name;

       include        fastcgi_params;

      

       access_log  /home/wwwlogs/access.log  main;

   }

}

 

/etc/init.d/nginx start     启动nginx服务


/etc/init.d/php-fpm start     启动php-fpm服务


 

 

在master1或者master2上执行下面命令,创建个web网站所需的数据库:


> create database metinfo;

> grant all on metinfo.* to'met'@'192.168.2.%' identified by '123456';

> flush privileges;

 

 

在浏览器访问http://192.168.2.11 如下图:


注意数据库主机地址要填:192.168.2.100


五、在MHA的基础上添加一个Slave

生产环境中,光靠2个Master是顶不住那么大压力的,因此还需要添加几个Slave节点(假设节点IP 192.168.2.11)。

 

修改Slave的my.cnf 如下

[mysqld]

....主要修改如下:....

innodb_file_per_table =ON

skip_name_resolve = ON

 

log-bin=mysql-bin

binlog_format=mixed

server-id   = 10

relay_log =mysql-relay.bin

log_slave_updates = 1

read_only = 1

replicate-ignore-db = test

replicate-ignore-db = mysql

 

在业务低谷时候,先将keepalived进程停掉,防止写入数据


然后稍等片刻,等2个master之间的数据同步后,在任意master上执行:


> flush tables with read lock;


# mysqldump -uroot -proot -A >all.sql


# scp all.sqlroot@192.168.2.11:/root/

 

在干净的slave上启动MariaDB,并导入all.sql


# mysql -uroot -proot -e 'sourceall.sql;'

 

导入后,在刚才锁表的master上解除锁


> unlock tables;

 

操作完成后,在master1和master2上启动keepalived进程,让VIP再次出现。

 

VIP出现后,然后,在slave上执行:


> change master to master_host='192.168.2.100',

master_user='repluser',

master_password='123456',

master_log_file='mysql-bin.000006',

master_log_pos=326;

 

> start slave;  启动复制

> show slave status\G

Keepalived+Master-Master-Slave组合_Keepalived+Master-Ma_06

这时候,我们可以在master1或者master2上任意创建库、表、插入数据,然后在slave上都可以看到数据已经正常同步过来了。



脚本change_master.sh内容如下:

#!/bin/bash

 

# 下面的是Master的虚拟IP,还有授权的账号和密码


VIP="192.168.2.100"

user="root"

passwd="123456"

 

# 复制账号和密码

repluser="repluser"

replpasswd="123456"

 

# 本地MySQL管理账号等

host="192.168.2.11"

man_user="root"

man_pass="123456"

 

# 查看Master的二进制日志信息

FILE=$(/usr/local/mariadb/bin/mysql -u$user -p$passwd -h $VIP -e 'show master status;'|sed -n '2p'|awk '{print$1}')

POS=$(/usr/local/mariadb/bin/mysql  -u$user -p$passwd -h $VIP -e 'show masterstatus;'|sed -n '2p'|awk '{print $2}')

 

# 将本机修改成Slave状态

mysql -u$man_user -p$man_pass -h$host -e "stop slave;"

mysql -u$man_user -p$man_pass -h$host -e "reset slave all;"

mysql -u$man_user -p$man_pass -h$host -e "change master to master_user='${repluser}',master_host='${VIP}',master_password='${replpasswd}',master_log_file='${FILE}',master_log_pos=${POS};"

mysql -u$man_user -p$man_pass -h$host -e "start slave;"

 

# 输出执行结果

REPL_STATUS=$(mysql  -e 'show slave status\G'|sed -n '12,13p'|grep-c "Yes")

if [[ $REPL_STATUS != 2 ]];then

    echo-e "\033[31mChange Status to Slave,Failed!\033[0m"

else

    echo-e "\033[32mChange Status to Slave,Success!\033[0m"

fi

 

 

脚本monitor_slave.sh内容如下:

#!/bin/bash

# Description: 每2秒钟检测从节点的状态,如果状态不是2个Yes,则执行上面的change_master.sh脚本

 

while true;do

{

    if[[ `mysql -uroot -e 'show slave status\G'|grep -c "Yes"`  != 2 ]] ;then

       echo-e "\033[30mwill auto change slave status $(date "+%F %T")\033[0m" >> /tmp/slave.log

       /bin/bash change_master.sh

    else

       echo-e "\033[32mHealth Status: OK  $(date "+%F %T")\033[0m" >> /tmp/slave.log

    fi

}

sleep 2

done


nohup sh monitor_slave.sh &

将监控进程运行在后台,不断监控slave的同步状态,如果发现同步线程不是2个Yes,则自动执行change_master.sh,重新配置主从关系。




假设我们还有一个配置好的slave,IP为192.168.2.15。那么现在的情况是:


Master1:192.168.2.13

Master2:192.168.2.14

VIP:192.168.2.100

Slave1:192.168.2.12

Slave2:192.168.2.15

Web服务器:192.168.2.11


haproxy的安装配置

演示用法而已,我们就将haproxy安装到192.168.2.12上,能验证效果即可。


软件版本:

haproxy-1.5.4-2 【haproxy1.6配置文件和以往的有点不一样,这里没有用最新的】

yum install haproxy -y

cd /etc/haproxy

 

vim haproxy.cfg 修改配置文件,修改好的配置文件如下:

global

   log         127.0.0.1 local2

    chroot     /var/lib/haproxy

    pidfile    /var/run/haproxy.pid

    maxconn    4000

    user       haproxy

    group      haproxy

    daemon

 

    stats socket /var/lib/haproxy/stats

 

defaults

    mode                    tcp

    log                     global

    option                  dontlognull

    retries                 3

    timeout http-request    10s

    timeout queue           1m

    timeout connect         10s

    timeout client          1m

    timeout server          1m

    timeout http-keep-alive 10s

    timeout check           10s

    maxconn                 3000

 

## 定义一个监控页面,监听在1080端口,并启用了验证机制

listen stats

    mode http

    bind 0.0.0.0:1080

    stats enable

    stats hide-version

    stats uri     /haproxy

    stats realm   Haproxy\ Statistics

    stats auth    admin:123456

    stats admin if TRUE

 

listen mysql

    bind 0.0.0.0:3336

    mode tcp

    option mysql-check user haproxy_check   # 定义了一个用于后端的mysql健康检查的用户[主要:这个用户要在后端的slave上存在才行]

    balance roundrobin

    server slave1 192.168.2.12:3306 weight 1check  inter 1s rise 2 fall 2

    server slave2 192.168.2.15:3306 weight 1check  inter 1s rise 2 fall 2

 

在各个mysqlslave节点上创建账号

创建允许haproxy连接到数据库的账号获取其运行状态

> GRANT PROCESS ON *.* TO'haproxy_check'@'192.168.2.%';

> flush privileges;

 

再创建一个访问的账号,一会要通过它连接haproxy的3336节点尝试访问slave,以便验证是否能负载均衡

> GRANT ALL ON *.* TO'lirl'@'192.168.2.%' identified by '123456';

> flush privileges;

 

启动haproxy

/etc/init.d/haproxy start

 

浏览器访问http://192.168.2.12:1080/haproxy

输入用户名admin 密码123456 进到下面的界面:




一、环境说明


 


1、操作系统内核版本:2.6.9-78.ELsmp


    2、Keepalived软件版本:keepalived-1.1.20.tar.gz


 


二、环境配置


 


1、主Keepalived服务器IP地址 192.168.111.223


2、备Keepalived服务器IP地址  192.168.111.100


3、Keepalived虚拟IP地址  192.168.111.150


 


三、软件下载地址


       http://www.keepalived.org/software/keepalived-1.1.20.tar.gz

 

四、安装流程


    1、上传Keepalived至/home/目录


    2、解压Keepalived软件


      [root@localhost home]# tar -zxvf keepalived-1.1.20.tar.gz 


      [root@localhost home]# cd keepalived-1.1.20


      [root@localhost keepalived-1.1.20]# ln -s /usr/src/kernels/2.6.9-78.EL-i686/usr/src//linux


      [root@localhost keepalived-1.1.20]# ./configure 


 

  遇到错误提示:configure: error: Popt libraries is required


  这个错误是因为没有安装popt的开发包导致的,解决方法也很简单,只要yum install popt-devel 就可以安装好popt的开发包了。


  重新./configure


  没有遇到跳过这一步


   3、提示

Keepalived+Master-Master-Slave组合_Keepalived+Master-Ma_07

4、编译以及编译安装

      [root@localhost keepalived-1.1.20]# make && make install

  5、将types.h调用的部分注释掉即可解决4出现的问题

     vi/usr/src/kernels/2.6.9-78.EL-i686/include/linux/types.h 

     到158行操作如下

     

   #endif 

    

    

 6、重新编译以及编译安装

     [root@localhost keepalived-1.1.20]# make && make install

7修改配置文件路径

       [root@localhostkeepalived-1.1.20]#cp/usr/local/etc/rc.d/init.d/keepalived/etc/rc.d/init.d/

       [root@localhostkeepalived-1.1.20]# cp /usr/local/etc/sysconfig/keepalived /etc/sysconfig/

       [root@localhost keepalived-1.1.20]# mkdir /etc/keepalived

       [root@localhostkeepalived-1.1.20]#cp /usr/local/etc/keepalived/keepalived.conf/etc/keepalived/                           

       [root@localhost keepalived-1.1.20]# cp /usr/local/sbin/keepalived /usr/sbin/

   8、设置为服务,开机启动

       [root@localhost keepalived-1.1.20]# vi /etc/rc.local 

五、主Keepalived配置

     1、修改配置文件

        [root@localhost keepalived-1.1.20]# vi /etc/keepalived/keepalived.conf 

六、备Keepalived配置

       1、修改配置文件

七、启动服务

八、查看网卡信息

 1、主Keepalived网卡信息

Keepalived+Master-Master-Slave组合_Keepalived+Master-Ma_08

九、验证测试

 1、在主服务器上新建一个网页,内容为 192.168.111.223

 2、在备用服务器上新建一个网页,内容为 192.168.111.100

 3、启动主备服务器的http服务和Keepalived服务

 4、通过浏览数,输入虚拟IP地址 192.168.111.150

        页面显示为 192.168.111.223

5、关闭主服务器的Keepalived服务,通过浏览器输入IP地址192.168.111.150

        页面显示为 192.168.111.100

6、再次启动主服务器的Keepalived服务,通过浏览器输入IP地址192.168.111.150

        页面显示为 192.168.111.223