一、Redis集群概述

Redis作为当前非常热门的内存型数据结构存储,可用于数据存储,缓存和消息代理等。本文将讲解如何基于docker搭建Redis集群,Redis的集群设计包括两个部分:主从复制和哈希Slot。

1. 主从复制

主从复制在数据库中很常见,一般用来做读写分离,Redis中也是如此。要求只有1个Master(主节点),可以有N个slaver(从节点),而且Slaver也可以有自己的Slaver,由于这种主从的关系决定他们是在配置阶段就要指定他们的上下级关系,而不是Zookeeper那种平行关系是自主推优出来的。

读写分离,Master只负责写和同步数据给Slaver,Slaver承担了被读的任务,所以Slaver的扩容只能提高读效率不能提高写效率。

Slaver先将Master那边获取到的信息压入磁盘,再load进内存,client端是从内存中读取信息的。当一个新的Slaver加入到这个集群时,会主动找Master来拜码头,Master发现新的小弟后将全量数据发送给新的Slaver,数据量越大性能消耗也就越大,所以尽量避免在运行时做Slaver的扩容。

  • 优点:读写分离,通过增加Slaver可以提高并发读的能力。
  • 缺点:Master写能力是瓶颈,维护Slaver开销也总将会变成瓶颈。

2. 哈希Slot

哈希Slot名字上可能不好理解,其实就是数据库中的“水平划分”。如果你之前有了解过数据库的表分区的话,就会发现下来对于哈希Slot的描述,就和数据库表分区里面的“HASH分区”原理上大致相同。




查看redis数据有效时间_Redis


对象保存到Redis之前先经过CRC16哈希到一个指定的Node上,例如图中Object4最终Hash到了Node1上。

每个Node被平均分配了一个Slot段,对应着0-16384,Slot不能重复也不能缺失,否则会导致对象重复存储或无法存储。

Node之间也互相监听,一旦有Node退出或者加入,会按照Slot为单位做数据的迁移。例如Node1如果掉线了,0-5640这些Slot将会平均分摊到Node2和Node3上,由于Node2和Node3本身维护的Slot还会在自己身上不会被重新分配,所以迁移过程中不会影响到 5641-16384 Slot段的使用。

  • 优点:将Redis的写操作分摊到了多个节点上,提高写的并发能力,扩容简单。
  • 缺点:每个Node承担着互相监听、高并发数据写入、高并发数据读出,工作任务繁重。

3. 合二为一

看到这里大家也就发现了,主从和哈希的设计优缺点正好是相互弥补的,将二者结合在一起,就是Redis集群的终极形态,先Hash分逻辑节点,然后每个逻辑节点内部是主从,如图:


查看redis数据有效时间_docker_02


二、集群安装

默认我们已经有了docker环境,现在开始基于docker安装Redis集群。redis 5.0 版本之前,网上有很多教程都是通过redis-trib.rb 来创建集群,但是redis 5.0 版本以后,就只能通过 redis-cli 来实现。本文即通过 redis-cli 创建集群,因为redis集群的节点选举方式是需要半数以上的master通过,所以建议创建奇数个节点。本例中创建3个Master节点,并为每个Master节点各分配1个Slave节点。

1. 宿主机环境

首先需要找一份原始的redis.conf文件,将其重命名为:redis-cluster.tmpl,并配置如下几个参数,此文件的目的是生成每一个redis实例的redis.conf:


查看redis数据有效时间_Redis_03


vi redis-cluster.tmpl


查看redis数据有效时间_docker_04


然后执行下列脚本,给3个Master和3个Slave创建各自的挂载卷目


查看redis数据有效时间_redis_05


录当前目录结构为


查看redis数据有效时间_查看redis数据有效时间_06


2. 创建Redis节点

假设我们只考虑单纯的docker环境,并无docker-compose和k8s之类的服务编排,每个redis容器之间必须要保证通讯,可以通过创建docker network。(使用微服务编排的情况,后续再讨论)


查看redis数据有效时间_Redis_07


现在我们就可以运行docker redis 的 master 和 slave 实例了


查看redis数据有效时间_docker_08


查看已创建的redis容器


查看redis数据有效时间_Redis_09


3. 构建集群

通过redis-cli 命令构建集群,随便找一个redis容器,运行redis-cli --cluster create --cluster-replicas 1 ip:port 命令即可


查看redis数据有效时间_Redis_10


记住构建集群时,要保证节点redis数据为空,否则会出现下列错误。


查看redis数据有效时间_查看redis数据有效时间_11


4. 集群验证

集群搭建完成后,我们通过 redis-cli 命令连接集群节点验证一下。redis 集群节点的连接命令是通过 redis-cli -c -h ip - p {port}


查看redis数据有效时间_redis_12


查看redis数据有效时间_redis_13


可以看到通过 "cluster info"命令看到集群的基本信息,所有的slot (16384) 都分配完毕。然后通过 "cluster nodes" 命令查看到每个master节点的slot分配的区域。至此,redis集群基本安装成功。

三、后期运维

1. 基本命令

集群


查看redis数据有效时间_redis_14


节点


查看redis数据有效时间_redis_15


槽(slot)


查看redis数据有效时间_redis_16


2. 常见问题

  • (1)redis-cluster 把所有的物理节点映射到[ 0 ~ 16383 ]个slot(哈希槽)上,cluster负责维护 nodeslotvalue。
  • (2)集群任意一个节点中,如果master挂掉,但是还有slaver,slave将自动升为 master,系统正常。
  • (3)集群任意一个节点中,如果master挂掉,并且没有slaver,集群将进入fail状态。
  • (4)如果集群超过半数以上节点的master挂掉,不管是否有slaver,集群都将进入fail状态。
  • (5)节点判断是否失效的选举,是集群中所有的master参与的,如果半数以上的master节点与当前被检测的master节点通讯检测超时(cluster-node-timerout),就认为当前master节点挂掉了。