正常大家都这么问的,但是实际上应该是想问:kafka和redis queue有什么区别?

因为redis是一个基于内存的kv数据库,而kafka是分布式发布订阅消息系统。两者本身不是同样一个层次的东西。

redis中有一个queue的数据类型,用来做发布/订阅系统,这个就可以和kafka进行比较了哈。

存储介质不同

redis queue数据是存储在内存,虽然有AOF和RDB的持久化方式,但是还是以内存为主。
kafka是存储在硬盘上

性能不同

因为存储介质不同,理论上redis queue的性能要优于kafka,但是在实际使用过程,这块体验并不是很明显,通常只有一些高并发场景下需要用redis queue,比如发红包,可以先将红包预先拆解然后push到redis queue,在抢的一瞬间可以很好的支撑并发。

成本不同

这边要划重点,划重点,划重点。

kafka存储在硬盘上,成本会比内存小很多,具体差1,2个数量级是有,在数据量非常大的情况下,使用kafka能够节省蛮多服务器成本。最常见的有应用产生的日志,这些日志产生的量级一般都很大,如果有需要进行处理,可以使用kafka队列。

消息可靠

redis存储在内存中,一旦服务异常或者宕机,数据就会丢失。相对来说kafka存储在硬盘更加安全。

订阅机制

这边也是比较重点,订阅机制主要有两点不同:

  1. kafka消费了之后,可以重新消费。redis消费(lpop)了数据之后,数据就从队列里消失了。kafka里面是偏移量(offset)的概念,可以设置到前面重新消费。
  2. redis只支持单一的消费者,只有topic模式。kafka不光有topic,还支持group分组模式,可以有多个消费组,消费同一个topic的消息。比如应用产生的行为日志,走kafka就很合适,大数据部门可以消费做数据分析,开发部门可以消费做后续的业务逻辑。

总结

总结来看,主要就是两点:

  1. 存储介质不一样,因为存储介质的不同,造成性能、成本、可靠性的差异。
  2. 订阅机制不一样。