Redis集群搭建(1主+2从+3哨兵)

一、Redis集群整体架构

这里我们采用的集群的整体架构是主从结构+哨兵(sentinel),实现了容灾的自动切换。

redis一主三从三哨兵的搭建 redis一主二从三哨兵_redis

一个主节点(master)可拥有多个从节点(slave),从节点实现对主节点的复制,保证数据同步。而哨兵(sentinel)则对各节点进行监控,主要包括主节点存活检测、主从运行情况检测等,一旦主节点宕机,哨兵可自动进行故障转移 (failover)、主从切换。

接下来就开始搭建这样一个集群,首先是主从结构,然后是哨兵模式。

1.1 安装redis

使用3台服务器,分别安装 redis

ip

port

role

192.168.180.196

7001

master

192.168.180.197

7002

slave

192.168.180.198

7003

slave

1.2 修改配置文件

1.首先,我们先看一下,redis配置文件,参数详解

# redis进程是否以守护进程的方式运行,yes为是,no为否。默认为no(不以守护进程的方式运行会占用
# 一个终端)。
daemonize no
# 指定redis进程的PID文件存放位置
pidfile /var/run/redis.pid
# redis进程的端口号
port 6379
# 是否开启保护模式,默认开启。要是配置里没有指定bind和密码。开启该参数后,
# redis只会本地进行访问,拒绝外部访问。要是开启了密码和指定bind,可以开启。
# 否则最好关闭设置为no。
protected-mode yes
# 绑定的主机地址
bind 127.0.0.1
# 客户端闲置多长时间后关闭连接,默认此参数为0即关闭此功能
timeout 300
# redis日志级别,可用的级别有debug.verbose.notice.warning
loglevel verbose
# log文件输出位置,如果进程以守护进程的方式运行,此处又将输出文件设置为stdout的话,
# 就会将日志信息输出到/dev/null里面去了
logfile stdout
# 设置数据库的数量,默认为0可以使用select <dbid>命令在连接上指定数据库id
databases 16
# 指定在多少时间内刷新次数达到多少的时候会将数据同步到数据文件
save <seconds> <changes>
# 指定存储至本地数据库时是否压缩文件,默认为yes即启用存储
rdbcompression yes
# 指定本地数据库文件名
dbfilename dump.db
# 指定本地数据问就按存放位置
dir ./
# 指定当本机为slave服务时,设置master服务的IP地址及端口,在redis启动的时候他会自动跟master进行数据同步
replicaof <masterip> <masterport>
# 当master设置了密码保护时,slave服务连接master的密码
masterauth <master-password>
# 设置redis连接密码,如果配置了连接密码,客户端在连接redis是需要通过AUTH<password>命令提供密码,默认关闭
requirepass footbared
# 设置同一时间最大客户连接数,默认无限制。redis可以同时连接的客户端数为redis程序可以打开的最大文件描述符,如果设置 maxclients 0,表示不作限制。当客户端连接数到达限制时,Redis会关闭新的连接并向客户端返回 max number of clients reached 错误信息
maxclients 128
# 指定Redis最大内存限制,Redis在启动时会把数据加载到内存中,达到最大内存后,Redis会先尝试清除已到期或即将到期的Key。当此方法处理后,仍然到达最大内存设置,将无法再进行写入操作,但仍然可以进行读取操作。Redis新的vm机制,会把Key存放内存,Value会存放在swap区
maxmemory<bytes>
# 指定是否在每次更新操作后进行日志记录,Redis在默认情况下是异步的把数据写入磁盘,如果不开启,可能会在断电时导致一段时间内的数据丢失。因为redis本身同步数据文件是按上面save条件来同步的,所以有的数据会在一段时间内只存在于内存中。默认为no。
appendonly no
# 指定跟新日志文件名默认为appendonly.aof
appendfilename appendonly.aof
# 指定更新日志的条件,有三个可选参数 - no:表示等操作系统进行数据缓存同步到磁盘(快),always:表示每次更新操作后手动调用fsync()将数据写到磁盘(慢,安全), everysec:表示每秒同步一次(折衷,默认值);
appendfsync everysec

2.master机器,参数配置

bind:0.0.0.0
port:7001
protected-mode:no
daemonize:yes
logfile:./redis.log
requirepass:123456
masterauth:123456

注释:

  • bind:0.0.0.0
    Redis 默认只允许本机访问,把 bind 修改为 0.0.0.0 表示允许所有远程访问。
    如果想指定限制访问,可设置对应的 ip。
  • port:6379
    监听端口默认为6379,想改其他也行。
  • protected-mode:no
    关闭保护模式,可以外部访问。
  • daemonize:yes
    设置为后台启动。
  • logfile:./redis.log
    redis 日志文件,生成后在 bin 目录下可找到。
  • requirepass:pwdtest@2019
    设置 redis 连接密码。
  • masterauth:pwdtest@2019
    slave 服务连接 master 的密码。

3.slave机器,参数配置

从机的配置和主机相似,不同的地方是需要使用replicaof指定主机(master)的IP地址和端口,需要注意的是老版本使用的是 slaveof,而本次使用的5.0.7版本要使用 replicaof ,如下

bind:0.0.0.0
port:7002
protected-mode:no
daemonize:yes
logfile:./redis.log
requirepass:123456
masterauth:123456
replicaof 192.168.180.196 7001

注释:

  • replicaof 192.168.231.130 6379
    指定当本机为 slave 服务时,设置 master 服务的IP地址及端口,在 redis 启动的时候会自动跟 master 进行数据同步,所以两台从机都这样配置即可。

注:由于我们搭建的集群需要自动容灾切换,主数据库可能会变成从数据库,所以三台机器上都需要同时设置 requirepass 和 masterauth 配置项。

1.3 数据同步

上面我们主从节点的配置文件配置好后,重启redis服务,在redis目录下,可以看到我们指定的redis.log 日志文件

此时,我们需要设置一下防火墙,否则,主从机之间无法同步数据,

需要先检查防火墙是否开启,否则防火墙设置不生效。

1.3.1 开启防火墙

  1. 检查防火墙是否开启:
systemctl status firewalld
  • dead : 未开启状态
  • running : 开启状态
  1. 开启防火墙:
systemctl start firewalld
  1. 确认防火墙是否开启
systemctl status firewalld

redis一主三从三哨兵的搭建 redis一主二从三哨兵_redis_02

此时,防火墙已经开启成功

  1. 关闭防火墙命令
systemctl stop firewalld

1.3.2 设置防火墙

firewall-cmd --add-port=6379/tcp --permanent --zone=public

此处 port 根据自己的进行修改,执行完此命令,出现 success 即表示,设置成功!

设置完之后,需要重启防火墙

firewall-cmd --reload

然后,重启 redis 服务

1.3.3 验证数据同步

此时,主从结构已经搭建完毕,主从机可以实现数据同步

使用 info replication 命令分别查看三台机器信息:

redis一主三从三哨兵的搭建 redis一主二从三哨兵_Redis_03

redis一主三从三哨兵的搭建 redis一主二从三哨兵_服务器_04

redis一主三从三哨兵的搭建 redis一主二从三哨兵_redis_05

接下来,我们在 master 机器中添加数据,可以看到在 slave 机器中,可以获取成功。

1.4 哨兵(sentinel)

1.4.1 哨兵模式详解

Redis Sentinel是Redis 的高可用性解决方案,由一个或多个Sentinel(哨兵)实例组成。它可以监视任意多个主服务器,以及这些主服务器属下的所有从服务器,并在被监视的主服务器进入下线状态时,自动将下线主服务器属下的某个从服务器升级为新的主服务器,它的主要功能如下:

  • 监控(Monitoring): Sentinel会不断地检查你的主服务器和从服务器是否运作正常。
  • 通知(Notification): 当被监控的某个 Redis 服务器出现问题时, Sentinel可以通过API向管理员或者其他应用程序发送通知。
  • 故障迁移: 当主服务器不能正常工作时,Sentinel会自动进行故障迁移,也就是主从切换。
  • 统一的配置管理: 连接者询问sentinel取得主从的地址。

1.4.2 哨兵原理

Sentinel 使用的算法核心是 Raft 算法,主要用途就是用于分布式系统,系统容错,以及Leader选举,每个Sentinel都需要定期的执行以下任务:

  • 每个 Sentinel 会自动发现其他 Sentinel 和从服务器,它以每秒钟一次的频率向它所知的主服务器、从服务器以及其他 Sentinel 实例发送一个 PING 命令。
  • 如果一个实例(instance)距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 那么这个实例会被 Sentinel 标记为主观下线。 有效回复可以是: +PONG 、 -LOADING 或者 -MASTERDOWN 。
  • 如果一个主服务器被标记为主观下线, 那么正在监视这个主服务器的所有Sentinel要以每秒一次的频率确认主服务器的确进入了主观下线状态。
  • 如果一个主服务器被标记为主观下线, 并且有足够数量的Sentinel(至少要达到配置文件指定的数量)在指定的时间范围内同意这一判断, 那么这个主服务器被标记为客观下线。
  • 在一般情况下, 每个Sentinel会以每 10 秒一次的频率向它已知的所有主服务器和从服务器发送 INFO 命令。 当一个主服务器被Sentinel标记为客观下线时,Sentinel向下线主服务器的所有从服务器发送 INFO 命令的频率会从 10 秒一次改为每秒一次。
  • 当没有足够数量的Sentinel同意主服务器已经下线, 主服务器的客观下线状态就会被移除。 当主服务器重新向Sentinel的 PING 命令返回有效回复时, 主服务器的主管下线状态就会被移除。

redis一主三从三哨兵的搭建 redis一主二从三哨兵_服务器_06

1.4.3 配置文件详解

哨兵的配置文件为 sentinel.conf , 在 redis 解压目录下即可看到

各参数详解:

# 哨兵sentinel实例运行的端口,默认26379  
port 26379
# 哨兵sentinel的工作目录
dir ./
# 是否开启保护模式,默认开启。
protected-mode:no
# 是否设置为后台启动。
daemonize:yes

# 哨兵sentinel的日志文件
logfile:./sentinel.log

# 哨兵sentinel监控的redis主节点的 
## ip:主机ip地址
## port:哨兵端口号
## master-name:可以自己命名的主节点名字(只能由字母A-z、数字0-9 、这三个字符".-_"组成。)
## quorum:当这些quorum个数sentinel哨兵认为master主节点失联 那么这时 客观上认为主节点失联了  
# sentinel monitor <master-name> <ip> <redis-port> <quorum>  
sentinel monitor mymaster 127.0.0.1 6379 2

# 当在Redis实例中开启了requirepass,所有连接Redis实例的客户端都要提供密码。
# sentinel auth-pass <master-name> <password>  
sentinel auth-pass mymaster 123456  

# 指定主节点应答哨兵sentinel的最大时间间隔,超过这个时间,哨兵主观上认为主节点下线,默认30秒  
# sentinel down-after-milliseconds <master-name> <milliseconds>
sentinel down-after-milliseconds mymaster 30000  

# 指定了在发生failover主备切换时,最多可以有多少个slave同时对新的master进行同步。这个数字越小,完成failover所需的时间就越长;反之,但是如果这个数字越大,就意味着越多的slave因为replication而不可用。可以通过将这个值设为1,来保证每次只有一个slave,处于不能处理命令请求的状态。
# sentinel parallel-syncs <master-name> <numslaves>
sentinel parallel-syncs mymaster 1  

# 故障转移的超时时间failover-timeout,默认三分钟,可以用在以下这些方面:
## 1. 同一个sentinel对同一个master两次failover之间的间隔时间。  
## 2. 当一个slave从一个错误的master那里同步数据时开始,直到slave被纠正为从正确的master那里同步数据时结束。  
## 3. 当想要取消一个正在进行的failover时所需要的时间。
## 4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来同步数据了
# sentinel failover-timeout <master-name> <milliseconds>  
sentinel failover-timeout mymaster 180000

# 当sentinel有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本。一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被一个SIGKILL信号终止,之后重新执行。
# 对于脚本的运行结果有以下规则:  
## 1. 若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10。
## 2. 若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。  
## 3. 如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。
# sentinel notification-script <master-name> <script-path>  
sentinel notification-script mymaster /var/redis/notify.sh

# 这个脚本应该是通用的,能被多次调用,不是针对性的。
# sentinel client-reconfig-script <master-name> <script-path>
sentinel client-reconfig-script mymaster /var/redis/reconfig.sh

1.4.4 哨兵搭建

  1. 编辑 sentinel.conf
vim sentinel.conf
  1. 修改参数
# 端口默认为26379。
port:26379
# 关闭保护模式,可以外部访问。
protected-mode:no
# 设置为后台启动。
daemonize:yes
# 日志文件。
logfile:./sentinel.log
# 指定主机IP地址和端口,并且指定当有2台哨兵认为主机挂了,则对主机进行容灾切换。
sentinel monitor mymaster 192.168.180.196 6379 2
# 当在Redis实例中开启了requirepass,这里就需要提供密码。
sentinel auth-pass mymaster 123456
# 这里设置了主机多少秒无响应,则认为挂了。
sentinel down-after-milliseconds mymaster 3000
# 主备切换时,最多有多少个slave同时对新的master进行同步,这里设置为默认的1。
sentinel parallel-syncs mymaster 1
# 故障转移的超时时间,这里设置为三分钟。
sentinel failover-timeout mymaster 180000
  1. 防火墙设置
firewall-cmd --add-port=26379/tcp --permanent --zone=public
#重启防火墙(修改配置后要重启防火墙)
firewall-cmd --reload
  1. 启动哨兵
cd /redis-5.0.7/src
./redis-sentinel ../sentinel.conf

另外两台机器,按上述步骤,进行配置哨兵

  1. 三台哨兵都启动后,使用 info sentinel 命令查看哨兵
./redis-cli -p 6379
info sentinel

可以看到,哨兵已经监听到当前的主机IP端口和运行状态,并且有2台从机,3个哨兵。

1.4.5 容灾切换

现在我们模拟主机宕机,将 master 的 redis 服务关闭

kill

然后,看另外两台机器

可以看到,哨兵sentinel 通过选举,将其中一台 slave 机器,选举为 master