为什么需要Redis集群
- 需要提高更大的并发量
- Redis官方提出拥有10万QPS的请求量
- 如果业务需要Redis拥有100万的QPS
- 可以通过集群来提升并发量。
- 需要存储更大的数据量
- 一般服务器的机器内存为16G-256G
- 如果业务需要500G的数据量
- 可以通过集群的分区技术来扩展数据量
数据分区
1.顺序分区
例如一共有编号为1~100的100条数据,一共有3个分区ABC,则需要预先设计
- 1~33号数据落入A分区
- 34~66号数据落入B分区
- 67~100号数据落入C分区
2.哈希分区
hash(key) % node_count
3.顺序分区 VS 哈希分区
分布方式 | 特点 | 典型产品 |
哈希分布 | 数据分散度高 键值分布与业务无关 无法顺序访问 | 一致性哈希Memcache Redis Cluster 其他缓存产品 |
顺序分布 | 数据分散度易倾斜 键值分布与业务有关 可顺序访问 | BigTable HBase |
哈希分区
1.节点取余分区
- 含义:hash(key) % node_count
- 优点:hash+取余的方式计算节点的分区很简单
- 缺点:当节点伸缩时候,数据节点关系发生变化,导致数据迁移
- 扩容的时候建议翻倍扩容,可以降低数据的迁移量。
不建议使用这用方式来分区,这样数据的改变时,发生数据迁移很影响性能。
2.一致性哈希分区
- 含义:哈希+顺时针(优化取余)
- 约定长度232位的哈希环,在其中分布若干个hash点。
- 第一步对每个key做哈希处理得到hashVal
- 第二步将hashVal顺时针偏移,得到的第一个hash点,即为分区的落点
- 优点:节点伸缩的时候,只会影响邻近节点,但是还是会有数据迁移
- 翻倍的伸缩,可以保证最小的迁移数据且达到数据的负载均衡
3.虚拟槽分区–redis cluster使用的分区方式
- 预设虚拟槽,每个槽映射一个数据子集,一般比节点数大
- 采用CRC16(key) & 16383来决定节点
- 每个节点顺序地平均分布16384个槽,即当有5个节点时
- A 0 ~ 3276
- B 3277 ~ 6553
- C 6554 ~ 9830
- D 9831 ~ 13107
- E 13108 ~ 16383
RedisCluster架构
一、节点
由多个master主节点组成,各个master都负责去读写,每个master都有各自的slave节点。
每个node的cluster_enabled配置为yes
二、Gossip协议
多个master节点之间会使用Gossip协议进行通信
1.meet消息
用于通知新节点加入。消息发送者通知接收者加入到当前集群,meet消息通信正常完成后,接收节点会加入到集群中并进行周期性的ping、pong消息交换。
当A meet B以及A meet C之后,B就可以与C做交互了
2.ping消息
集群中交换最频繁的消息,集群内各个节点每秒向多个其他节点发送ping消息,用于检测节点是否在线和交换彼此状态信息。
ping消息发送封装了自身节点和部分其他节点的状态数据。
3.pong消息
当接收到ping、meet消息时,作为响应消息回复给发送方确认消息正常通信。
pong消息内部封装了自身状态数据。
节点也可以向集群内广播自身的pong消息来通知整个集群对自身状态进行更新
4.fail消息
当节点判定集群内另一个节点下线时,会向集群内广播一个fail消息,其他节点接收到fail消息之后把对应节点更新诶下线状态
三、指派槽
需要为RedisCluster指派槽,指定各个master节点的槽范围,让它进行正常的读写
四、复制
每个master节点包含若干个slave节点,形成主从复制的形式,以提高高可用性。
通过各个节点之间相互监控来达到Sentinel的目的
RedisCluster安装
RedisCluster主要配置
命令 | 含义 |
cluster-enabled yes | 节点是否开启集群模式 |
cluster-node-timeout 15000 | 节点主观下线超时时间,毫秒 |
cluster-config-file “nodes.conf” | 集群配置文件 |
cluster-require-full-coverage no | 是否需要所有节点全都可用,集群才能对外服务,此处推荐设置为no |
一、原生命令安装
1.配置开启节点
port : 7000、7001、7002、7003、7004、7005
port ${port}
daemonize yes
dir "/redisDataPath"
dbfilename "dump-${port}.rdb"
logfile "${port}.log"
cluster-enabled yes
cluster-config-file nodes-${port}.conf
2.meet
cluster meet ip port
#例如在7000端口上依次执行
cluster meet 127.0.0.1 7001
cluster meet 127.0.0.1 7002
cluster meet 127.0.0.1 7003
cluster meet 127.0.0.1 7004
cluster meet 127.0.0.1 7005
通过redis-cli -p 7000 cluster nodes 来查看节点的消息是否互通
3.指派槽
cluster addslots slot [slot...]
#可以通过编写脚本shell方便实现
#addslot.sh
port=$1
start=$2
end=$3
for slot in `seq ${start} ${end}`
do
echo "slot:${slot}"
redis-cli -p ${port} cluster addslots ${slot}
done
#
./addslot.sh 7000 0 5461
./addslot.sh 7001 5462 10922
./addslot.sh 7002 10922 16383
4.设置主从
#可以在任一节点上执行cluster nodes命令查看所有节点的node_id等信息
redis-cli -p 7000 cluster nodes
#在从节点上执行以下操作表示复制master节点
cluster replicate node-id
#
redis-cli -h 127.0.0.1 -p 7003 cluster replicate ${node-id-7000}
redis-cli -h 127.0.0.1 -p 7004 cluster replicate ${node-id-7001}
redis-cli -h 127.0.0.1 -p 7005 cluster replicate ${node-id-7002}
二、官方工具安装
./redis-trib.rb create --replicas 1 127.0.0.1:8000 127.0.0.1:8001
127.0.0.1:8002 127.0.0.1:8003 127.0.0.1:8004 127.0.0.1:8005
# 1 代表每个master有1个slave
# 此时,一共6个节点,每个master有1个slave,即前3个会形成master节点,后3个会形成slave节点
注意:这里你如果后序使用过win主机编程,测试虚拟机中的redis集群的话,这个ip应该换成虚拟机的
实际IP地址,而不是使用127.0.0.1
三、原生命令 VS redis-trib.rb
优点 | 缺点 | |
原生命令 | 易于理解Redis Cluster架构 | 生产环境不使用,太麻烦,容易犯错 |
redis-trib.rb | 高效,准确 生产环境可以使用 |
==>关于Ruby的安装,我在搭建的时候出现了版本过低的,
可能是因为粗心,显示版本ruby版本过低,我又重新安装了ruby-2.6.3.tar.gz最新稳定版的版本
下载
Ruby环境准备
– 下载ruby —
cd /soft/tools
wget https://cache.ruby-lang.org/pub/ruby/2.3/ruby-2.3.4.tar.gz
– 安装ruby —
tar zxf ruby-2.3.4.tar.gz
cd ruby-2.3.4
./configure --prefix=/soft/ruby-2.3.4
make
make install
ln -s /soft/ruby-2.3.4 /soft/ruby
cd /soft/ruby
cp bin/ruby /usr/local/bin/
cp bin/gem /usr/local/bin/
– 安装rubygem redis依赖 —
wget http://rubygems.org/downloads/redis-3.3.0.gem gem install -l redis-3.3.0.gem
gem list --check redis gem 这一步可能报错,不影响
– 安装redis-rb管理工具 —
[root@test ruby]# cp /soft/tools/redis-3.2.0/src/redis-trib.rb /usr/local/bin/
redis目录下的bin