# 前言
在高并发的分布式系统中,缓存是必不可少的一部分,如果没有缓存,大量的请求直接落到系统,系统是很难撑住高并发的冲击,所以分布式系统中缓存的设计是很重要的一部分。
运用缓存后可以加速读写、降低后端的负载,但同时又会出现运维成本,数据不一致性等问题。
下面介绍在运用缓存过程中可能会碰到的问题
# 缓存雪崩
缓存雪崩是由于原有的的缓存失效,新缓存还没有到期间,在这个期间原本所有的请求应该是先访问缓存,现在直接落在查询数据了,从而对数据库cpu和内存造成巨大压力,严重会导致数据库宕机。从而形成一系列连锁反应,造成系统雪崩。
一般情况下有三种处理方式:
在并发量不是特别大的情况下,可以使用加锁排队方式。
给每一个缓存数据增加相应的缓存标记,记录缓存的是否失效,如果缓存标记失效,则更新数据缓存。
为key设置不同的缓存失效时间。
# 缓存穿透
缓存穿透是指用户查询数据,在数据库里没有,那自然在缓存中也没有。这样就会导致用户查询的时候,在缓存中找不到,每次都要到数据库中查一遍,然后返回空值。这样请求就绕过缓存直接查数据库,这也是经常提的缓存命中率问题。
这种问题常用的解决方法是:
布隆过滤器:将所有可能存在的数据哈希到一个足够大的 bitmap中,一个一定不存在的数据会被这个 bitmap 拦截掉从而避免了对底层存 储系统的查询压力。
粗暴的方法,如果一个查询返回的数据为空(不管是数据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间会很短,最长不超过五分钟。 通过这个直接设置的默认值存放到缓存,这样第二次到缓冲中获取就有值了,而不会继续访问数据库。
# 缓存预热
是指系统上线后,将相关的缓存数据直接加载到缓存系统,这样就可以避免在用户请求的时候,先查询数据库,然后再将数据缓存的问题!用户直接查询事先被预热的缓存数据。
# 缓存更新
缓存更新除了缓存服务器自带的缓存失效策略之外(Redis 默认的有 6 中策略可供选择),我们还可以根据具体的业务需求进行自定义的缓存淘汰,常见的策略有两种:
定时去清理过期的缓存。
当有用户请求过来时,再判断这个请求所用到的缓存是否过期,过期的话就去底层系统得到新数 据并更新缓存。
# 缓存降级
当访问量剧增、服务出现问题(如响应时间慢或不响应)或非核心服务影响到核心流程的性能时,仍然需要保证服务还是可用的,即使是有损服务。系统可以根据一些关键数据进行自动降级,也可以配置开关实现人工降级。降级的最终目的是保证核心服务可用,即使是有损的。而且有些服务是无法降级的。