分布式缓存常见问题解决方案_分布式缓存

# 前言

在高并发的分布式系统中,缓存是必不可少的一部分,如果没有缓存,大量的请求直接落到系统,系统是很难撑住高并发的冲击,所以分布式系统中缓存的设计是很重要的一部分。

运用缓存后可以加速读写、降低后端的负载,但同时又会出现运维成本,数据不一致性等问题。

下面介绍在运用缓存过程中可能会碰到的问题

# 缓存雪崩

缓存雪崩是由于原有的的缓存失效,新缓存还没有到期间,在这个期间原本所有的请求应该是先访问缓存,现在直接落在查询数据了,从而对数据库cpu和内存造成巨大压力,严重会导致数据库宕机。从而形成一系列连锁反应,造成系统雪崩。

一般情况下有三种处理方式:

  • 在并发量不是特别大的情况下,可以使用加锁排队方式。

  • 给每一个缓存数据增加相应的缓存标记,记录缓存的是否失效,如果缓存标记失效,则更新数据缓存。

  • 为key设置不同的缓存失效时间。

# 缓存穿透

缓存穿透是指用户查询数据,在数据库里没有,那自然在缓存中也没有。这样就会导致用户查询的时候,在缓存中找不到,每次都要到数据库中查一遍,然后返回空值。这样请求就绕过缓存直接查数据库,这也是经常提的缓存命中率问题。

这种问题常用的解决方法是:

  • 布隆过滤器:将所有可能存在的数据哈希到一个足够大的 bitmap中,一个一定不存在的数据会被这个 bitmap 拦截掉从而避免了对底层存 储系统的查询压力。

  • 粗暴的方法,如果一个查询返回的数据为空(不管是数据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间会很短,最长不超过五分钟。 通过这个直接设置的默认值存放到缓存,这样第二次到缓冲中获取就有值了,而不会继续访问数据库。

# 缓存预热

是指系统上线后,将相关的缓存数据直接加载到缓存系统,这样就可以避免在用户请求的时候,先查询数据库,然后再将数据缓存的问题!用户直接查询事先被预热的缓存数据。

# 缓存更新

缓存更新除了缓存服务器自带的缓存失效策略之外(Redis 默认的有 6 中策略可供选择),我们还可以根据具体的业务需求进行自定义的缓存淘汰,常见的策略有两种:

  • 定时去清理过期的缓存。

  • 当有用户请求过来时,再判断这个请求所用到的缓存是否过期,过期的话就去底层系统得到新数 据并更新缓存。

# 缓存降级

当访问量剧增、服务出现问题(如响应时间慢或不响应)或非核心服务影响到核心流程的性能时,仍然需要保证服务还是可用的,即使是有损服务。系统可以根据一些关键数据进行自动降级,也可以配置开关实现人工降级。降级的最终目的是保证核心服务可用,即使是有损的。而且有些服务是无法降级的。