keepalive简介    

      目前互联网主流的实现WEB网站及数据库服务高可用软件包括:keepalived、heartbeat等。Heartbeat是比较早期的实现高可用软件,而keepalived是目前轻量级的管理方便、易用的高可用软件解决方案,得到互联网公司IT人的青睐。

Keepalived是一个类似于工作在layer3, 4 & 7交换机制的软件,Keepalived软件有两种功能,分别是监控检查、VRRP冗余协议,keepalived是模块化设计,不同模块负责不同的功能,keepalived常用模块包括:

1)Core,是keepalived的核心,负责主进程的启动和维护,全局配置文件的加载解析等 。

2) Check,负责healthchecker(健康检查),包括了各种健康检查方式,以及对应的配置的解析包括LVS的配置解析;

3)  Vrrp,VRRPD子进程,VRRPD子进程就是来实现VRRP协议;

4)  Libipfwc,iptables(ipchains)库,配置LVS会用到;

5) Libipvs,虚拟服务集群,配置LVS会使用。

        Keepalived的作用是检测web服务器的状态,如果有一台web服务器、Mysql服务器宕机,或工作出现故障,Keepalived将检测到后,会将有故障的web服务器或者Mysql服务器从系统中剔除,当服务器工作正常后Keepalived自动将web、Mysql服务器加入到服务器群中。

这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的WEB和Mysql服务器。Layer3,4&7工作在IP/TCP协议栈的IP层、传输层及应用层,实现原理分别如下:

1)Layer3:Keepalived使用Layer3的方式工作式时,Keepalived会定期向服务器群中的服务器发送一个ICMP的数据包(如果发现某台服务的IP地址无法ping通,Keepalived便报告这台服务器失效,并将它从服务器集群中剔除。Layer3的方式是以服务器的IP地址是否有效作为服务器工作正常与否的标准。)

2)  Layer4: Layer4主要以TCP端口的状态来决定服务器工作正常与否。如WEB server的服务端口一般是80,如果Keepalived检测到80端口没有启动,则Keepalived将把这台服务器从服务器群中剔除。

3)  Layer7:Layer7工作在应用层,Keepalived将根据用户的设定检查服务器程序的运行是否正常,如果与用户的设定不相符,则Keepalived将把服务器从服务器群中剔除。

生产环境使用Keepalived正常运行,共启动3个进程,一个是父进程,负责监控其子进程,一个是VRRP子进程,另外一个是Checkers子进程。

        两个子进程都被系统Watchlog看管,两个子进程各自负责自己的事,Healthcheck子进程检查各自服务器的健康状况,如果Healthcheck进程检查到Master上服务不可用了,就会通知本机上的VRRP子进程,让他删除通告,并且去掉虚拟IP,转换为BACKUP状态。

二、 Keepalived VRRP原理剖析

     Virtual Router Redundancy Protocol(VRRP)技术,虚拟路由器冗余协议。VRRP由IETF提出,目的是为了解决局域网中配置默认网关的单点失效问题,1998年已推出正式的RFC2338协议标准。

       VRRP广泛应用在边缘网络中,它的设计目标是支持特定情况下IP数据流量失败转移不会引起混乱,允许主机使用单路由器,以及及时在实际第一跳路由器使用失败的情形下仍能够维护路由器间的连通性。

       在现实的网络环境中,两台需要通信的主机大多数情况下并没有直接的物理连接。对于这样的情况,它们之间路由怎样选择?主机如何选定到达目的主机的下一跳路由,这个问题通常的解决方法有二种:

1)  在主机上使用动态路由协议RIP、OSPF;

2)  在主机上配置静态路由.

        在主机上配置路态路由是非常不切实际的,因为管理、维护成本以及是否支持等诸多问题。配置静态路由就变得十分流行,但路由器(或者说默认网关default gateway)却经常成为单点,VRRP的目的就是为了解决静态路由单点故障问题。VRRP通过一竞选(election)协议来动态的将路由任务交给LAN中虚拟路由器中的某台VRRP路由器。

        通过VRRP技术可以将两台物理主机当成路由器,两台物理机主机组成一个虚拟路由集群,Master高的主机产生VIP,该VIP负责转发用户发起的IP包或者负责处理用户的请求,Nginx+Keepalived组合,用户的请求直接访问keepalived VIP地址,然后访问Master相应服务和端口。

       在VRRP虚拟路由器集群中,由多台物理的路由器组成,但是这多台的物理路由器并不能同时工作,而是由一台称为MASTER路由器负责路由工作,其它的都是BACKUP,MASTER并非一成不变,VRRP会让每个VRRP路由器参与竞选,最终获胜的就是MASTER。

MASTER拥有一些特权,例如拥有虚拟路由器的IP地址或者成为VIP,拥有特权的MASTER要负责转发发送给网关地址的包和响应ARP请求。

        VRRP通过竞选协议来实现虚拟路由器的功能,所有的协议报文都是通过IP组播(multicast)包(组播地址 224.0.0.18)形式发送的。虚拟路由器由VRID(范围0-255)和一组IP地址组成,对外表现为一个周知的MAC地址。所以在一组虚拟路由器集群中,不管谁是MASTER,对外都是相同的MAC和VIP。客户端主机并不需要因为MASTER的改变而修改自己的路由配置。

         作为MASTER的VRRP路由器会一直发送VRRP组播包(VRRP Advertisement message),BACKUP不会抢占MASTER,除非它的优先级(Priority)更高。当MASTER不可用时(BACKUP收不到组播包时), 多台BACKUP中优先级最高的这台会抢占为MASTER。这种抢占是非常快速的,以保证服务的连续性。由于安全性考虑VRRP包使用了加密协议进行,基于VRRP技术,可以实现IP地址漂移,是一种容错协议,广泛应用于企业生产环境中。

三、Keepalived高可用架构概念

1)学习Linux技术,从事Linux运维工作,最主要的工作职责保证企业门户网站、数据库、业务系统、IT硬件设备等高效稳定的运行,如何才能保障网站、数据库等稳定运行呢?如何才能保证高可用呢?

2)高可用的概念:不是说网站、业务系统不宕机,是宕机的时间比较短,影响业务比较小,一定时间、范围内,可以运行网站、业务系统有异常(难免的),衡量网站的高可用有一个俗语:全年网站可用率以9个数百分比衡量,例如:99.9%、99.99%、99.999%等;

3)为了确保WEB架构、业务系统、硬件设备的高效、稳定的运行的话,可以引入高可用方案:

      基于SHELL脚本实现高可用;

      基于Keepalived软件实现高可用;(主流的高可用软件)

      基于Heartbeat软件实现高可用;(最早期使用软件)

4)Keepalived高可用软件,是一种类似于工作在三(网络层)、四(传输层)、七层(应用层)的交换机制的软件,Keepalived高可用软件两个核心功能:

    健康检测功能;

    VRRP冗余功能;

5)Keepalived监控检测功能检测方案:可以以如下三种方式去检测,如果发现WEB网站、数据库服务器宕机或者异常,可以从服务列表(服务池)移除该服务器,等待服务器恢复以后,Keepalived可以将服务器加入到服务列表(服务池),三种方式检测案例如下:

      Keepalived可以网络层工作方式,以IP形式去监控客户端(网站、数据库);

      Keepalived可以传输层工作方式,以IP+端口形式去监控客户端(网站、数据库);

      Keepalived可以应用层工作方式,以HTTP、FTP等协议形式去监控客户端(网站、数据库);

6)Keepalived高可用软件模块剖析:

     Core,是keepalived的核心,负责主进程的启动和维护,全局配置文件的加载解析等 。

     Check,负责healthchecker(健康检查),包括了各种健康检查方式,以及对应的配置的解析包括LVS的配置解析;

    Vrrp,VRRPD子进程,VRRPD子进程就是来实现VRRP协议;

    Libipfwc,iptables(ipchains)库,配置LVS会用到;

    Libipvs,虚拟服务集群,配置LVS会使用。

7)Keepalived可以实现VRRP冗余功能,冗余功能(高可用功能),将2台路由器(服务器)组成冗余集群,同一时刻一台服务器对外提供服务,当一台服务器宕机以后,会自动切换至另外服务器。

8)VRRP冗余技术剖析:

     是虚拟路由器冗余技术,严格来讲不仅仅属于Keepalived软件的;

     基于VRRP技术可以将多台路由器(主机)组成一个虚拟路由器集群;

     虚拟路由器集群中,根据优先级选举产生:Master和Backup,Master拥有特殊权限:绑定VIP(虚拟IP),同时对外响应用户的请求或者转发用户请求;

     Master路由器(主机)定时向集群组内发送组播包(组播地址:224.0.0.18),BACKUP接收组播包,一旦接收不到(认为Master宕机),其他BACKUP会根据优先级重新选举Master;在一组虚拟路由器集群中,不管谁是MASTER,对外都是相同的MAC和VIP。