目录
- 概述
- 单哨兵模式
- 多哨兵模式
- 测试单哨兵
- 哨兵模式的优缺点
- 哨兵模式配置文件中的全部配置
概述
主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器(Slave)切换为主服务器(Master),这就需要人工干预,费时费力,还会造成一段时间内服务不可用。
手动调节不是一种推荐的方式,更多的时候我们有限考虑哨兵(Sentinel)模式。Redis从2.8开始正式提供了Sentinel(哨兵)架构来解决这个问题。
哨兵模式相当于谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库。
单哨兵模式
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行,其原理就是哨兵通过发送命令,等到Redis服务器响应,从而监控运行的多个Redis实例。
哨兵的两个作用:
- 通过发送命令,让Redis 服务器返回监控其运行状态,包括主服务器和从服务器。
- 当哨兵检测到Master宕机时,会通过投票机制自动将Slave切换成Master,然后再通过发布订阅模式通知其它的从服务器,修改配置文件,让它们切换主机。
多哨兵模式
单个哨兵进程对Redis服务器进行监控时可能会出现一些问题(比如说哨兵挂掉),为此我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。由于一个哨兵就需要一个进程,哨兵集群至少要三个哨兵才能保证健壮性,因此要配置多哨兵,起步就是6个进程。
多哨兵模式中,如果主机宕机了会怎么样?
假设主服务器宕机,哨兵1先检测到这个结果,但是系统并不会马上进行重新选举和filover过程,因为仅仅是哨兵1主观认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器连接不上了,并且数量达到一定值时(3个哨兵中两个哨兵检测主机不能使用了,那么就认为这个主机挂掉了),那么哨兵之间就会对从机中进行一次选举主机的投票,投票的结果由其中任意一个哨兵发起,然后进行failover(故障转移)操作,选举新主机成功后就将该从机切换成主机,之后就会通过发布订阅模式(所有的服务都被哨兵监控着),让各个哨兵把自己监控的从服务器实现切换主机,这个过程成为客观下线。
测试单哨兵
集群还是之前使用的伪集群(一主二从,单机多服)
1、配置哨兵配置文件sentinel.conf
在Redis的bin目录下有一个redis.sentinel
文件,这个文件用于启动哨兵的启动文件,接下来还需要一个哨兵的配置文件,我们需要自己去创建。
在bin目录下使用vim sentinel.conf
去创建一个文件并且写入以下命令:
# sentinel monitor 被监控的名称 host port 1
sentinel monitor myredis 192.168.15.133 6379 1
后面的数字1表示的是:如果主机挂了,Slave投票看谁成为新主机,票数最多的就会成为主机,这个1就相当于一个是主机的标志。
注意:上面的配置是开启哨兵的最关键的配置,拼写不能写错了,如果写错了或者少写就会启动哨兵失败。
2、启动哨兵
配置好第一步的文件后,首先我们还是使用的一主二从的伪集群,79端口为主机,80、81端口为79的从机,并且三个服务器都启动并且连接上Redis,第四个用于启动命令测试。
第四个窗口中执行命令:./redis.sentinel sentinel.conf
执行启动哨兵之后就如上图所示,有相关端口26379,并且输出哪个是主节点,主节点下从机的个数,并且启动哨兵之后不断地监控着主机和从机,如果主机或者从机发生宕机了或者出问题了就会输出对应的信息,并且做相应的操作。
3、假设主机6379宕机(断开连接)了,哨兵会做一些什么操作?
如果主节点Master断开连接了,这个时候哨兵会通过投票机制从机中随机选择一个服务器。
- 主机6379挂掉:
- 哨兵日志就会输出下列信息:
当主机挂掉以后,哨兵会检测到该主机连接断开了,那么它会重新再去检测一下,如果还是断开连接的,那么就开始在从机中进行选举,选举出一个新的主机,接着进行故障转移fileover,上图测试中将从机6381选举成了主机,并且将其它服务器设置为新主机的从机,连断开的那个主机也设置成新主机的从机,从最后三行代码可以知道,如果这个时候主机连接上来了,那么它也会被设置为新主机的从机,这就是哨兵模式。
哨兵模式的优缺点
优点
- 哨兵集群,基于主从复制模式,所有的主从配置的优点,它都有。
- 主从可以切换,故障可以转移,系统的可用性就会更好。
- 哨兵模式就是主从模式的升级版,从收到到自动,更加健壮。
缺点
- Redis不好在线扩容,集群容量一旦达到上限,在线扩容就会十分麻烦。
- 实现哨兵模式的配置比较麻烦,并且其中有很多选项。
哨兵模式配置文件中的全部配置
# Example sentinel.conf
# 哨兵sentinel实例运行的端口 默认是26379,如果有哨兵集群,我们还需要配置每个哨兵端口
port 26379
#哨兵sentinel的工作目录
dir /tmp
下面这项是哨兵配置的重点
#哨兵 sentine1 监控的redis主节点的 ip port
# master-name ,可以自己命名的主节点名字 只能由字母A-Z、数字0-9、这三个字符" . - _ "组成。
# quorum配置多少个sentine1哨兵统- -认为master主节点失联那么这时客观上认为主节点失联了
# sentine1 monitor <master-name> <ip> <redis-port> <quorum>
sentinel monitor mymaster 127.0.0.1 6379 2
#当在Redis实例中开启了requirepass foobared 授权密码这样所有连接kedis实例的客户端都要提供密码
#设置哨兵sentinel连接主从的密码注意必须为主从设置- - 样的验证密码
# sentine1 auth-pass <master-name> <password>
sentine1 auth-pass mymaster MySUPER--secret-0123passwOrd
#指定多少毫秒之后主节点没有应答哨兵sentine1 此时哨兵主观上认为主节点下线默认30秒
# sentinel down-after-mi 11i seconds <master-name> <mi 11iseconds>
sentine1 down-after-mi 11iseconds mymaster 30000
#这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行同步,这个数字越小,完成fai lover所需的时间就越长,但是如果这个数字越大,就意味着越多的slave因为replication而 不可用。可以通过将这个值设为1来保证每次只有一个slave处于不能处理命令请求的状态。
# sentine1 paralle1-syncs <master-name> <numslaves>
sentine1 paralle1-syncs mymaster 1
#故障转移的超时时间failover-timeout 可以用在以下这些方面:
#1.同一个sentine1对同一 个master两次fai lover之间的间隔时间。
#2.当一个slave从一 个错误的master那里同步数据开始计算时间。直到s1ave被纠正为向正确的master那里同步数据时。
#3.当想要取消一个正在进行的failover所需要的时间。
#4.当进行failover时,配置所有s1aves指向新的master所需的最大时间。不过,即使过了这个超时,slaves 依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了
#默认三分钟
# sentine1 failover-timeout <master-name> <milliseconds>
sentine1 fai lover-ti meout mymaster 180000
# SCRIPTS EXECUTION
#配置当某一事件发生时所需要执行的脚本,可以通过脚本来通知管理员,例如当系统运行不正常时发邮件通知相关人员。
#对于脚本的运行结果有以下规则:
#若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10
#若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。
#如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。
#一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被-一个SIGKILL信号终止,之后重新执行。
#通知型脚本:当sentine1有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本,这时这个脚本应该通过邮件,SMS等 方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时,将传给脚本两个参数,一 个是事件的类型,一个是事件的描述。如果sentine1. conf配置文件中配置了这个脚本路径,那么必须保证这个脚本存在于这个路径,并且是可执行的,否则sentine1无法正常启动成功。
#通知脚本
# she11编程
# sentine1 notification-script <master-name> <script-path>
sentine1 notificati on-script mymaster /var/redis/notify. sh
#客户端重新配置主节点参数脚本
#当一个master由于failover而发生改变时,这个脚本将会被调用,通知相关的客户端关于master地址已经发生改变的信息。
#以下参数将会在调用脚本时传给脚本:
# <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>
#目前<state>总是“failover",
# <role>是“Teader"或者"observer"中的-一个。
#参数from-ip, from-port, to-ip,to-port是用来和旧的master和新的master(即旧的s lave)通信的
#这个脚本应该是通用的,能被多次调用,不是针对性的。
# sentine1 client-reconfig-script <master-name> <script-path>
sentine1 client-reconfig-script mymaster /var/redis/reconfig.sh #一般都是由运维来配置!