Kafka
消费者时
bootstrap.servers,也叫broker(IP、端口集群)
group.id:GroupId是一种逻辑概念,用于将消费者归类为一个组。同一组内的多个消费者可以共同消费同一个Topic的数据,并保证每条消息只被组内的一个消费者消费。这是Kafka实现多个消费者同时消费一个Topic的核心机制
client.id:在Kafka中,消费者的client.id是一个用于标识消费者的字符串,可以通过配置文件或代码进行配置。它的作用是在Kafka broker中将来自同一个client.id的消息分配给同一个消费者组中的一个消费者进行消费,
以保证消息被均衡地分配。如果不指定client.id,则会自动生成一个默认值,但这样会导致在消费者重新启动时,它的消费分区可能会发生变化,从而影响消费者的负载均衡。因此,在实际应用中,为了保证消费者的负载均衡和消费
进度的一致性,建议配置client.id,以便于kafka能够正确的分配分区和监控消费者的状态
msgId:Kafka未明确MsgId,通过topic、分区、offset来定位
enable.auto.commit:一般不配置,默认会自动提交offset
auto.offset.reset:用来指定consumer消费策略,包括下面这些
latest(默认):对于同一消费组,如果未提交过offset,则只消费消费者连接topic后新产生的数据
earliest:对于同一消费组,如果未提交过offset,则从头开始消费
none:对于同一消费组,如果未提交过offset,抛异常,生产几乎用不到
共同定义:对于同一消费组,如果已经提交过offset,则从提交的offset接着消费

mqcp
公司基于rocketmq拓展
消费者时
每隔算子会有自己单独的MQCPConsumer实例
serverAddress:域名
virtual_account:扩展概念,用来区分开发、测试、生产环境,因为对云鸽来说只有生产环境
CONSUMER_ID:消费者ID(其实就是消费者组ID,共享消息)
INSTANCE_NAME:相当于应用实例唯一标识,随机数生成,要求每个应用实例不一样
tags:扩展概念,对消息分类,只过滤满足tags的数据

phmq
子公司基于rocketmq拓展
消费者时
每次新接一个topic,需要新建一个算子,但是所有算子是共用一个PHMQService

不同mq的区别?
ActiveMQ
- 优点
单机吞吐量万级,时效性 ms 级,可用性高,基于主从架构实现高可用性,消息可靠性较低的概率丢失数据
- 缺点
官方社区现在对 ActiveMQ 5.x 维护越来越少,高吞吐量场景较少使用。

Kafka
- 官网介绍
超过80%的财富100强公司信任并使用卡夫卡。
Apache Kafka是一个开放源代码的分布式事件流平台,被数千家公司用于高性能数据管道、流分析、数据集成和任务关键型应用程序。
- 优点
性能卓越,单机写入TPS 约在百万条/秒,最大的优点,就是吞吐量高。时效性 ms 级可用性非常高,kafka 是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用,消费者采用 Pull 方式获取消息, 消息有序, 通过控制能够保证所有消息被消费且仅被消费一次;有优秀的第三方Kafka
- 缺点
Kafka 单机超过 64 个队列/分区,Load 会发生明显的飙高现象,队列越多,load 越高,发送消息响应时间变长,使用短轮询方式,实时性取决于轮询间隔时间,消费失败不支持重试;支持消息顺序,但是一台代理宕机后,就会产生消息乱序,社区更新较慢;

RocketMQ
- 官网介绍
由于ActiveMQ和Kafka不能满足阿里的需求,他们决定发明一种新的消息传递引擎来处理更广泛的用例集,从传统的发布/订阅场景到高容量实时零丢失容错事务系统。我们相信这个解决方案是有益的,所以我们希望向社区开放源代码。今天,有100多家公司在其业务中使用开源版本的RocketMQ。
- 优点
分布式的,扩展性好,支持 10 亿级别的消息堆积,不会因为堆积导致性能下降,源码是 java 我们可以自己阅读源码,定制自己公司的 MQ
- 缺点
核心中去实现 JMS 等接口,有些系统要迁移需要修改大量代码
RabbitMQ
- 官网介绍
RabbitMQ 是部署最广泛的开源消息代理。
RabbitMQ拥有数万用户,是最流行的开源消息代理之一。从T-Mobile到Runtastic,RabbitMQ在世界各地的小型初创公司和大型企业中使用。
RabbitMQ是轻量级的,易于在本地和云中部署。它支持多种消息传递协议。RabbitMQ可以在分布式和联合配置中部署,以满足高规模、高可用性需求。
RabbitMQ运行在许多操作系统和云环境上,并为最流行的语言提供了广泛的开发工具。
- 优点
由于 erlang 语言的高并发特性,性能较好;吞吐量到万级,MQ 功能比较完备,健壮、稳定、易用、跨平台、支持多种语言 如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等,支持 AJAX 文档齐全;开源提供的管理界面非常棒,用起来很好用,社区活跃度高;更新频率相当高
- 缺点
商业版需要收费,学习成本较高

二、MQ 的应用场景及选择
1. ActiveMQ
ActiveMQ支持任何消息传递用例的能力和灵活性,比较适合小型吞吐量比较小的公司进行使用,或者MQ起步学习的首选。

2. Kafka
Kafka 主要特点是基于Pull 的模式来处理消息消费,追求高吞吐量,一开始的目的就是用于日志收集
和传输,适合产生大量数据的互联网服务的数据收集业务。大型公司建议可以选用,大数据分析必备,如果有日志采集功能,肯定是首选 kafka 了。

3. RocketMQ
天生为金融互联网领域而生,对于可靠性要求很高的场景,尤其是电商里面的订单扣款,以及业务削
峰,在大量交易涌入时,后端可能无法及时处理的情况。RoketMQ 在稳定性上可能更值得信赖,这些业务场景在阿里双 11 已经经历了多次考验,如果你的业务有上述并发场景,建议可以选择 RocketMQ。

4. RabbitMQ
结合 erlang 语言本身的并发优势,性能好时效性微秒级,社区活跃度也比较高,管理界面用起来十分方便,如果你的数据量没有那么大,中小型公司优先选择功能比较完备的 RabbitMQ。