后端开发人员在使用Redis时的注意事项,我们分为设计阶段和使用阶段来讲,先讲设计阶段。
设计阶段
1.缓存数据筛选
我们知道Redis是一个缓存数据库,他的数据都是存放在内存中的,所以能够实现高效的存取和写入,但内存单位的高昂代价注定了其难以取代磁盘,作为数据的最终存储介质。使用缓存最重要的作用就是降低存储层的承受压力,提高请求的响应速度,所以如何选择数据很关键。注定了不能缓存所有数据,那么站在存储层的角度,自然优先缓存那些访问最频繁的数据,也就是所谓的热点数据,如何判断是否为热点数据需要根据实际的业务场景作相应的择取。站在应用的角度,自然是将那些响应时间长的数据做缓存,能够有效的提高用户的使用体验。站在缓存的角度上,自然是希望缓存那些更新不是很频繁的数据,否则频繁的缓存重建就失去了缓存的意义了。站在Redis的角度,自然是希望能够将自身优势发挥出来的,缓存那些数据量不是很大,但是很关键的数据,比如用户登录信息等,同时能够发挥自身特点,比如高速存储和写入,可以执行简单的算术操作,可以设置被动过期时间等。从多个方面考虑缓存数据的筛选问题,是设计阶段应该优先考虑的事情。
2.缓存粒度控制
粒度,就是缓存是数据的相对多少问题。粒度越大,操作时越简单,但占用空间越多,且缓存重建时需要的资源就越多;粒度越小,控制越复杂,但占用空间想小,且缓存重建时需要的资源就越少,这就是一个缓存性能,空间和操作的平衡问题。假设用户的信息由A,B,C三部分组成,每次获取的时候A和B用的较多,C用的不多,此时缓存的策略有4中情况:
1. A,B,C合并后缓存
2. A,B合并缓冲,C不作缓存
3. A,B,C各自分开缓存
4. A,B缓存,C不作缓存
每种缓存策略均有各自的优势及局限性,第一种情况下,从缓存提取简单,但占据空间大,且若A,B,C中的一个数据发生改变均需要重建整个缓存;第二种情况能降低占据空间,但是提高提取缓存的操作复杂性;第三种策略提取操作最复杂,占据空间大,但是重建缓存的性能最好;第四种能降低占据空间,但是提高了缓存重建的复杂性。
如何权衡缓存的粒度控制,需要根据实际业务提前设计好。
3.缓存更新策略
根据不同的业务场景指定不同的缓存更新策略。
一致性:缓存数据和真实数据源的数据一致。
对于低一致性要求的业务场景,可以配置Redis的最大内存配合淘汰策略作用。缓存淘汰策略可以使用LRU(Least Recently Used),LFU(Least Frequently Used)和FIFO(First In First Out)等。
对于高一致性要求的业务场景,可以使用Redis的超时剔除和主动更新策略。
4.缓存穿透优化
缓存穿透是指查询一个根本不存在的数据,缓存层和存储层都不会命中。通常处于容错的考虑,如果从存储层查询不到数据则不会写入缓存层。缓存穿透将导致请求不存在的数据每次都要到存储层去在找,就失去了缓存保护后端存储的意义。
造成缓存穿透的原因主要有两个:
1. 自身业务代码或者数据出现问题
2. 一些恶意攻击或爬虫造成大量空命中
对于缓存穿透,可以给不存在的数据缓存一个空对象,同时设置超时时间。如果在此期间缓存层和存储层的数据不一致,可使用消息系统或者其他操作剔除缓存中的空对象。
5.热点key重建
对于并发量较大的应用,当一个热点key重建时,可能会触发多个线程同时执行重建工作。多个线程同时重建,耗费额外性能生成资源,同时可能会有多次的缓存替换操作,对整体性能可能有一定影响。此时可以使用互斥锁机制,保证同一时间对于同一key只有一个线程能够执行重建工作。但是要注意,如果重建工作耗时较长,可能存在死锁和线程阻塞的风险。
6.缓存雪崩应对
缓存的层级位于客户端和存储层之间,能够有效的降低存储层的压力,但缓存可能存在不可用的情况,如何应对这种情形?
首先自然是降低缓存层的宕机几率,有条件可以使用Redis Sentinel和Redis Cluster。
其次隔离缓存和存储层的数据获取接口,防止缓存的宕机影响存储层的数据获取。
最后在项目上线前演练缓存宕机的情形,在此基础上做一预案设定。
好的架构和代码都需要有一个好的设计,如果设计阶段就出了偏差,那么在编程阶段无论怎么调整都难以弥补。
使用阶段
我们从数据存储和数据获取两个方面来说明开发时的注意事项。
1.数据存储
因为内存空间的局限性,注定了能存储的数据量有限,如何在有限的空间内存储更多的数据信息是我们应该关注的。Redis内存储的都是键值对,那么如何减小键值对所占据的内存空间就是空间优化的本质。
在能清晰表达业务含义的基础上尽可能缩减Key的字符长度,比如一个键是user:{id}:logintime ,可以使用业务属性的简写来u:{id}:lgt,只要能清晰表达业务意义,使用简写形式是有其必要性的。
在不影响使用的情况下,缩减Value的数据大小。如果Value是较大的数据信息,比如图片,大文本等,可以使用压缩工具压缩过后再存入Redis;如果Value是对象序列化或者gson信息,可以考虑去除非必要的业务属性。
减少键值对的数量,对于大量的String类型的小对象,可以尝试使用Hash的形式组合他们,在Hash对象内Field数量少于1000,且Value的字符长度小于40时,内部使用ziplist的编码形式,能够极大的降低小对象占据的内存空间。
Redis内维护了一个[0-9999]的整数对象池,类似Java内的运行时常量池,只创建一个常量,使用时都去引用这个常量,所以当存储的value是这个范围内的数字时均是引用向都一个内存地址,所以能够降低一些内存空间耗费。但是共享对象池和maxmemory+LRU的内存回收策略冲突,因为共享Value对象的lru值也共享,难以通过lru知道哪个Key的最后引用时间,所以永远也不能回收内存。
如果多次数据操作要求原子性,可使用Multi来实现Redis的事务。
2.数据查询
Redis是一种数据库,和其他数据库一样,操作时也需要有连接对象,连接对象的创建和销毁也需要耗费资源,复用连接对象很有必要,所以推荐使用连接池来管理连接。
Redis数据存储在内存中,查询很快,但不代表连接也很快。一次Redis查询可能IO部分占据了请求时间的绝大部分比例,缩短IO时间是开发过程中很需要注意的一点。
对于一个业务内的多次查询,考虑使用Pipeline,将多次查询合并为一次查询,命令会被执行多次,但是只有一个IO传输,能够有效的提高响应速度。
对于多次String类型的查询,使用mget,将多次请求合并为一次,同时命令和会被合并为一次,能有效提高响应速度,对于Hash内多个Field查询,使用hmget,起到和mget同样的效果。
Redis是单线程执行的,也就是说同一时间只能执行一条命令,如果一条命令执行的时间较长,其他线程在此期间均会被阻塞,所以在操作Redis时要注意操作指令的涉及的数据量,尽量降低单次操作的执行时间。