追加消息到 RecordAccumulator 的时候会根据对应的 topic 分区信息获取队列,然后将消息放到 batches 集合中,最后使用一个 Sender 线程迭代 batches 的每个分区

Sender 发送线程的两种发送方式

  • 按照分区直接发送:有多少个分区就要发送多少次请求
  • 按照分区的目标节点发送:把属于同一个节点的所有分区放在一起发送,减少网络开销

Sender 流程

  • 消息被 RecordAccumulator 按照分区追加到队列的最后一个批记录中
  • Sender 通过 ready() 从 RecordAccumulator 中找出已经准备好的服务端节点
  • 如果节点已经准备好,但是客户端还没有和它们建立连接,通过 connect() 建立到服务端节点的连接
  • Sender 通过 drain() 从 RecordAccumulator 获取按照节点整理好的每个分区的批记录
  • Sender 得到每个节点的批记录后,为每个节点创建请求,并发送到服务端

从 RecordAccumulator 获取数据

  • 追加到 RecordAccumulator 的消息按照分区放好,发送线程读取数据的时候,RecordAccumulator 按照节点将消息重新分组 再交给 Sender
  • batches 存储结构
  • 分区存储 batches:ConcurrentMap<TopicPartition, Deque>
  • 节点存储 batches:Map<Integer, List>
  • 从分区存储 batches 转为节点存储 batches 流程
  • 迭代分区存储 batches 的每个分区,获取 TopicPartition 对应的节点 NodeId
  • 获取分区存储的批记录队列中的第一个批记录 RecordBatch
  • 将相同节点的所有批记录放在一起,放入 List 中,数据结构 Map<NodeId, List>

Sender 代码截取

void run(long now) {
	// TODO 获取元数据
	// 第一次里面没有元数据,第二次进来就有元数据
	Cluster cluster = metadata.fetch();
	// get the list of partitions with data ready to send 获取准备发送数据的分区列表
	// 判断哪些 partition 有消息可以发送,然后获取到这个 partition 的 leader partition 对应的 broker 主机
	RecordAccumulator.ReadyCheckResult result = this.accumulator.ready(cluster, now);
	// remove any nodes we aren't ready to send to 删除我们不准备发送到的所有节点
	// readyNodes 可以发送消息的
	Iterator<Node> iter = result.readyNodes.iterator();
	while (iter.hasNext()) {
        Node node = iter.next();
        // TODO 检查与要发送数据的主机的网络是否已经建立好
        if (!this.client.ready(node, now)) {
            iter.remove();
        }
    }
	/**
	 * TODO 按照 broker 进行分组,同一个 broker 的 partition 为同一组
	 * create produce requests 创建生成请求
	 * 发送的 partition 有多个,可能有一些 leader partition 在同一台服务器上面
	 * 按照 broker 进行分组,同一个 broker 的 partition 为同一组
	 *  0:[p1,p2]
	 *  1:[p3,p4,p5]
	 */
	Map<Integer, List<RecordBatch>> batches = this.accumulator.drain(cluster,result.readyNodes,this.maxRequestSize,now);
	/**
	 * TODO 创建发送消息的请求
	 * 如果网络连接没有建立好,batches 还是为空,这里也不执行
	 * 创建请求
	 *      往 partition 上面发送消息的时候,有一些 partition 在同一台服务器上,如果一个个分区发送会浪费资源
	 *      发往同一个 broker 上面 partition
	 */
	List<ClientRequest> requests = createProduceRequests(batches, now);
	for (ClientRequest request : requests)
	    // TODO 发送请求
	    client.send(request, now);
}

创建生产者客户端请求

  • 从 RecordAccumulator 获取到的 batches 已经按照节点分组,produceRequest() 方法会为每个节点创建客户端请求
  • 由于每个节点的 batches 批记录对应一个分区,同一个节点有多个分区,所以需要把 batches 转成 Map<TopicPartition, ByteBuffer>
// run() -> createProduceRequests() -> produceRequest()

/**
 * Create a produce request from the given record batches
 * 从给定的记录批次创建一个生产请求
 */
private ClientRequest produceRequest(long now, int destination, short acks, int timeout, List<RecordBatch> batches) {
    Map<TopicPartition, ByteBuffer> produceRecordsByPartition = new HashMap<TopicPartition, ByteBuffer>(batches.size());
    final Map<TopicPartition, RecordBatch> recordsByPartition = new HashMap<TopicPartition, RecordBatch>(batches.size());
    for (RecordBatch batch : batches) {
        // 每一个 RecordBatch 都有唯一的 TopicPartition
        TopicPartition tp = batch.topicPartition;
        // RecordBatch 的 records 是 MemoryRecords,底层是 ByteBuffer
        produceRecordsByPartition.put(tp, batch.records.buffer());
        recordsByPartition.put(tp, batch);
    }
    // 构造生产者请求,最后封装为统一的客户端请求
    ProduceRequest request = new ProduceRequest(acks, timeout, produceRecordsByPartition);
    RequestSend send = new RequestSend(Integer.toString(destination),
                                       this.client.nextRequestHeader(ApiKeys.PRODUCE),
                                       request.toStruct());
    // 封装请求里面带一个回调函数,当客户端请求完成后,会调用回调函数
    RequestCompletionHandler callback = new RequestCompletionHandler() {
        public void onComplete(ClientResponse response) {
            // 回调函数执行的方法
            handleProduceResponse(response, recordsByPartition, time.milliseconds());
        }
    };
    return new ClientRequest(now, acks != 0, send, callback);
}

注意:Sender 并不是真正负责发送客户端请求的线程,只是获取数据并创建客户端请求,然后交给 NetworkClient 客户端网络对象去发送