单机Redis面临的问题

单机Redis在发生故障时,由于无法做到故障转移,所以接下来的请求将会直接打到数据库。

大量的查询使得数据库连接数达到峰值,且内部锁冲突严重,造成慢查询、连接超时等后果。

所以这个时候,我们想着能不能将Redis数据以多副本的形式保存在多台Redis上,当发生故障时,快速地手动去切换连接的Redis?

当然,Redis本身也提供了这个功能。

主从模式能将Master节点的数据冗余到多台Slave上,配合哨兵模式能够快速感知Master宕机从而进行主从切换实现故障转移。


主从模式拓扑图

主从模式又可被细分为一主一从、一主多从以及主从从的结构。

不管什么结构,各个从节点都会复制主节点的数据,以此来实现数据备份。

一主一从

Redis主从复制原理_数据

最精简的主从模式,老板最喜欢的模式。

当主节点出现故障时,从节点转变角色继续服务。

一主多从

 

Redis主从复制原理_数据_02

一主多从的结构,非常适用于读多写少的场景。

配合读写分离与负载均衡,即主节点只负责写请求,所有的查询请求被均分到各个从节点上,将大大提升Redis的吞吐量。

主从从

Redis主从复制原理_数据_03

一种使用级联的方式,Slave3并不是作为Master的直接从节点,而是间接从节点。

这样Slave3不需要请求Master去复制数据,只需要请求Slave1,有效降低Master节点的工作负载。

如何指定多个节点间的主从关系?

很简单,有以下方式:

  • 在redis.conf配置文件中,使用slaveof <masterip> <masterport>来永久指定主从关系
  • 在客户端中执行slaveof <masterip> <masterport>来临时指定主从关系
  • 在redis-server启动命令中加入slaveof <masterip> <masterport>来临时指定主从关系

如何断开主从关系?

执行slaveof no one即可,断开复制并不会清除已有的数据,只是不再进行复制。


主从复制原理

既然主从模式可以将数据冗余到其他节点上,那究竟是怎么保证主从数据的一致性呢?

当Slave初次连接上Master时,会进行全量复制。

全量复制

Redis主从复制原理_数据_04

1、Slave初次连接上Master时,会发送PSYNC命令,后面会跟上两个参数,分别是{runID}与{offset}。

runID

每个Redis实例在启动时,会生成一个唯一ID,记为runID。

offset

从节点的复制偏移量

这是Slave与Master的初次沟通,Slave自然不知道Master的唯一ID,因此这里runID的值为?初次复制的偏移量可以记为-1。

2、之后Master就知道Slave为初次复制,那么本次会执行全量复制。Master向Slave回复FULLRESYNC <runID> <offset>,其中<runID>就是Master的实例ID,<offset>为复制偏移量。

3、Slave在收到响应后,会将runID与offset保存在本地。

4、Master通过bgsave的方式,fork出一个子进程,由子进程完成RDB快照的生成。基于写时复制,主线程依然可以执行新的命令,但这些命令并不会被子进程实时扫描到。关于Redis的持久化方式,可以参考我的另外一篇文章​​谈谈Redis的持久化——AOF日志与RDB快照​

5、Master向Slave发送RDB数据。

6、Slave清空本地数据,加载RDB数据。

7、Master在生成RDB文件后,将之后新接收到的命令,存入复制积压缓冲区中。

复制积压缓冲区

Master内部维护了一个固定大小的FIFO队列,默认为1MB。

队列中的命令里的每一个字节都会有一个偏移量与之对应,当写满1MB后,头部的字节将会出队。

Redis主从复制原理_缓存_05

8、Master不断地将复制积压缓冲区内的命令发送给Slave

9、Slave在本地回放这些命令,当Slave的复制偏移量和缓冲区内的最大偏移量相同时,此时就代表Master和Slave是一致的。


增量复制

假如Slave由于网络闪断和Master连接失败,过了一会儿网络恢复正常,Slave重新与Master建立连接。

如果此时仍然要进行全量同步的话,效率低下。

因为网络闪断期间,Slave只是丢失了少量数据,不至于进行全量同步,进行增量同步即可。

Redis主从复制原理_数据库_06

1、Slave断线重连后,将Master的实例ID和断线前的复制偏移量发送给Master。

2、Master在收到复制请求后,会检验runID与offset。

对于runID,如果不等于当前Master的实例id,则代表发生过主节点宕机,某个从节点切换为主节点。此时Master会回复FULLRESYNC,代表接下来会执行全量同步。

如果等于当前Master的实例id,则继续检查offset。如果offset还在缓冲区内,则Master回复CONTINUE,代表接下来进行增量同步。

如果Slave断线太久,则offset代表的字节早已经出队,此时会进行全量同步。

3、Master依据指定的偏移量,从偏移量代表的字节开始,将命令发送给Slave。

4、Slave在本地回放这些命令。


总结

本文讲述了主从模式下的3种结构,以及每种结构的适用场景。

接着是主从之间的复制原理,分为全量复制和增量复制。

Master区分是全量复制还是增量复制,靠的是runID与offset参数。

第一次复制,则进行全量复制,Master生成RDB文件,并将之后生成的命令存入复制积压缓冲区。

Slave断线重连后,Master依据offset在复制积压缓冲区中选择传输的起始字节。找不到的话,则进行全量复制。