正常大家都这么问的,但是实际上应该是想问:kafka和redis queue有什么区别?
因为redis是一个基于内存的kv数据库,而kafka是分布式发布订阅消息系统。两者本身不是同样一个层次的东西。
redis中有一个queue的数据类型,用来做发布/订阅系统,这个就可以和kafka进行比较了哈。
存储介质不同
redis queue数据是存储在内存,虽然有AOF和RDB的持久化方式,但是还是以内存为主。
kafka是存储在硬盘上
性能不同
因为存储介质不同,理论上redis queue的性能要优于kafka,但是在实际使用过程,这块体验并不是很明显,通常只有一些高并发场景下需要用redis queue,比如发红包,可以先将红包预先拆解然后push到redis queue,在抢的一瞬间可以很好的支撑并发。
成本不同
这边要划重点,划重点,划重点。
kafka存储在硬盘上,成本会比内存小很多,具体差1,2个数量级是有,在数据量非常大的情况下,使用kafka能够节省蛮多服务器成本。最常见的有应用产生的日志,这些日志产生的量级一般都很大,如果有需要进行处理,可以使用kafka队列。
消息可靠
redis存储在内存中,一旦服务异常或者宕机,数据就会丢失。相对来说kafka存储在硬盘更加安全。
订阅机制
这边也是比较重点,订阅机制主要有两点不同:
- kafka消费了之后,可以重新消费。redis消费(lpop)了数据之后,数据就从队列里消失了。kafka里面是偏移量(offset)的概念,可以设置到前面重新消费。
- redis只支持单一的消费者,只有topic模式。kafka不光有topic,还支持group分组模式,可以有多个消费组,消费同一个topic的消息。比如应用产生的行为日志,走kafka就很合适,大数据部门可以消费做数据分析,开发部门可以消费做后续的业务逻辑。
总结
总结来看,主要就是两点:
- 存储介质不一样,因为存储介质的不同,造成性能、成本、可靠性的差异。
- 订阅机制不一样。