RabbitMQ是比较有代表性的,因为是基于主从(非分布式)做高可用性的。
RabbitMQ有三种模式:单机模式、普通集群模式、镜像集群模式。
单机模式
单机模式,也就是Demo级别的,一般是本地启动的。
普通集群模式(无高可用性)
普通集群模式,意思就是在多台机器上启动多个RabitMQ实例,每个机器启动一个RabbitMQ实例。创建的queue,只会放到一个RabbitMQ实例上,但是每个实例都同步queue的元数据(元数据可以认为是queue的一些配置信息,通过元数据,可以找到queue所在实例)。消费的时候,实际上如果连接到了另外一个实例,那么那个实例会从queue所在实例上拉取数据过来。
这种方式很麻烦,没做到所谓的分布式,就是个普通集群。因为这导致要么消费者每次随机连接一个实例,然后拉取数据,要么固定连接那个queue所在实例消费数据,前者有数据拉取的开销,后者导致单实例性能瓶颈。
而且如果那个放queue的实例宕机了,会导致接下来其他实例就无法从那个实例拉取,如果你开启了消费持久化,让RabbitMQ落地存储消息的话,消息不一定会丢,得等这个实例恢复了,然后才可以继续从这个queue拉取数据。这就没有什么所谓的高可用性,这方案主要是提高吞吐量的,就是说让集群中多个节点来服务某个queue的读写操作。
镜像集群模式(高可用性)
这种模式,才是所谓的RabbitMQ的高可用模式。跟普通集群模式不一样的是,在镜像集群模式下,创建的queue,无论元数据还是queue里的消息都会存在于多个实例上。也就是说,让每个RabbitMQ节点都有这个queue的一个完整镜像,包含queue的全部数据的意思,然后每次写消息到queue的时候,都会自动把消息同步到多个实例的queue上。
开启镜像集群模式,在后台新增一个策略,这个策略是镜像集群模式的策略,指定的时候是可以要求数据同步到所有节点的,也可以要求同步到指定数量的节点,再次创建queue的时候,应用这个策略,就会自动将数据同步到其他的节点上去了。这样的好处在于,任何一个机器宕机了,其他机器(节点)还包含了这个queue的完整的数据,别的consumer都可以到其他节点上去消费数据。
坏处在于,
第一、这个性能开销很大,消息需要同步到所有机器上,导致网络带宽压力和消耗很重。
第二、不是分布式的,就没有扩展性,如果某个queue负载很重,新增的机器也包含了这个queue的所有数据,并没有办法线性扩展queue。