对于三高系统,Redis是必须/必需的,当并发高到一定的程度就可能会出现HotKey的问题,今天我们来看下Redis中的HotKey如何解决。

什么是HotKey

在较短的时间内,海量请求访问一个Key,这样的Key就被称为HotKey。

HotKey的危害

  • 海量请求在较短的时间内,访问一个Key,势必会导致被访问的Redis服务器压力剧增,可能会将Redis服务器击垮,从而影响线上业务;
  • HotKey过期的一瞬间,海量请求在较短的时间内,访问这个Key,因为Key过期了,这些请求会走到数据库,可能会将数据库击垮,从而影响线上业务。(这是缓存击穿问题)

HotKey如何解决

HotKey如何解决是一个比较宽泛的问题,涉及到多个方面,我们一个个来看。

Redis部署

通常来说,Redis有两种集群形式:数据分片集群、主从+哨兵集群,其实这两种集群形式或多或少的都一定程度上缓解了HotKey的问题。

主从+哨兵集群

如果我们采用单主:

  • 所有的读请求都会打在仅有的一个Redis服务器,都不用管Key是什么,只要并发一高,就会导致Redis服务器压力剧增;
  • 一旦仅有的一个Redis服务器挂了,就没有第二个Redis服务器顶上去了,无法继续提供服务。

如果我们采用主从+哨兵集群:

  • 读请求会被分散到Master节点或者多台Slave节点,将请求进行了初步的分散;
  • Master节点挂了,Slave节点会升级为新的Master节点,继续提供服务。

数据分片集群

Key被分散在了不同的Redis节点,将请求进行了进一步的分散。

如果采用数据分片集群,同时也会部署主从+哨兵,这样又有了主从+哨兵集群的特性:

  • 读请求会被分散到Master节点或者多台Slave节点,将请求进行了初步的分散;
  • Master节点挂了,Slave节点会升级为新的Master节点,继续提供服务。

画外音:我以前一直以为大部分公司都已经采用了数据分片集群,其实不然,某个我认为不差钱的公司,在2021年采用的还是主从+哨兵集群,出了问题,才转变成数据分片集群,我到我们公司一瞧,才发现我们公司也是主从+哨兵集群。

隔离

不同的业务分配不同的Redis集群,不要将所有的业务都“混杂”在一个Redis集群。

只要可以做到集群+隔离,在一定程度上就已经避免了HotKey,但是对于超高并发的系统来说,可能还有点不够,所以才会有下面的更进一步的措施。

如何应对HotKey

这个问题,可以拆分成三个子问题:如何发现HotKey、如何通知HotKey的产生、如何对HotKey进行处理。

如何发现HotKey

如何发现HotKey的前提是知道每个Key的使用情况,并进行统计,所以这又拆成了两个更小的子问题:如何知道每个Key的使用情况,如何进行统计。

如何知道每个Key的使用情况

谁最清楚知道每个Key的使用情况,当然是客户端、代理层,所以我们可以在客户端或者代理层进行埋点。

客户端埋点

在客户端请求Redis的代码中进行埋点。

优点:

  • 实现较为简单
  • 轻量级
  • 几乎没有性能损耗

缺点:

  • 进行统一管理较为麻烦:如果想开启或者关闭埋点、上报,会比较麻烦
  • 升级、迭代较为麻烦:如果埋点、上报方式需要优化,就需要升级Jar包,再找一个黄道吉日进行发布
  • 客户端会有一定的压力:不管是实时上报使用情况,还是准实时上报使用情况,都会对客户端造成一定的压力
代理层埋点

客户端不直接连接Redis集群,而是连接Redis代理,在代理层进行埋点。

优点:

  • 客户端没有压力
  • 对客户端完全透明
  • 升级、迭代比较简单
  • 进行统一管理比较简单

缺点:

  • 实现复杂
  • 会有一定的性能损耗:代理层需要转发请求到真正的Redis集群
  • 单点故障问题:需要做到高可用,更复杂
  • 单点热点问题:代理层本身就是一个热点,需要分散热点,更复杂
如何上报每个Key的使用情况

我们在客户端或者代理层进行了埋点,自然是由它们上报每个Key的使用情况,如何上报又是一个小话题。

实时/准实时
  • 实时上报:每次请求,都进行上报
  • 准实时上报:积累一定量或者一定时间的请求,再进行上报
是否预统计

如果采用准实时上报,在客户端或者代理层是否对使用情况进行预统计:

  • 进行预统计:减少上报的数据量,减轻统计的压力,自身会有压力
  • 不进行预统计:上报的数据量比较多,自身几乎没有压力
如何统计

不管如何进行上报,使用情况最终都会通过Kafka,发送到统计端,这个时候统计端就来活了。 一般来说,这个时候会借助于大数据,较为简单的方式:Flink开一个时间窗口,消费Kafka的数据,对时间窗口内的数据进行统计,如果在一个时间窗口内,某个Key的使用达了一定的阈值,就代表这是一个HotKey。

如何通知HotKey的产生

经过上面的步骤,我们已经知道了某个HotKey产生了,这个时候就需要通知到客户端或者代理层,那如何通知HotKey的产生呢?

  • MQ:用MQ通知客户端或者代理层HotKey是什么
  • RPC/Http:通过RPC/Http通知客户端或者代理层HotKey是什么
  • 配置中心/注册中心指令:既然遇到了HotKey的问题,并且想解决,那基本上是技术实力非常强大的公司,应该有非常完善的服务治理体系,此时,可以通过配置中心/注册中心下发指令到客户端或者代理层,告知HotKey是什么

如何处理HotKey

客户端或者代理层已经知晓了HotKey产生了,就自动开启一定的策略,来避免HotKey带来的热点问题:

  • 使用本地缓存,不至于让所有请求都打到Redis集群
  • 将HotKey的数据复制多份,分散到不同的Redis节点上

在实际开发中,可能在很大程度上,都不会有埋点、上报、统计,通知、策略自动开启,这一套比较完善的Redis HotKey解决方案,我们能做到的就是预估某个Key可能会成为热点,就采用本地缓存+复制多份HotKey数据的方式来避免HotKey带来的热点问题。我们还经常会因为偷懒,所以设计了一个大而全的Key,所有的业务都从这个Key中读取数据,但是有些业务只需要其中的一小部分数据,有些业务只需要另外一小部分数据,如果不同的业务读取不同的Key,又可以将请求进行分散,这是非常简单,而且有效的方式。

End