Kafka消费逻辑
简介:本文主要叙述KafkaConsumer消费逻辑(本文使用的是flink 中的Kafka-client),
是如何获取获取数据,这里直奔主题,从KafkaConsumer直接看起来。
1、唤醒 KafakaConsumerThread 线程消费
KafakaConsumerThread的 run 方法的逻辑主要在 KafakaConsumer#poll(long timeout) 里面,我们每次向 Kafka broker发送请求的时候,通常指定时间内不管有没有数据都会立即返回而不是一直等待知道有数据,这里一直在循环到指定的超时时间为止。参考代码如下:
public ConsumerRecords<K, V> poll(long timeout) {
do {
//进行一次消费
Map<TopicPartition, List<ConsumerRecord<K, V>>> records = pollOnce(remaining);
if (!records.isEmpty()) {
//获取到数据不为空时,继续新建一个请求(异步)。
if (fetcher.sendFetches() > 0 || client.pendingRequestCount() > 0)
client.pollNoWakeup(); //将请求发送出去
if (this.interceptors == null)
return new ConsumerRecords<>(records);
else
return this.interceptors.onConsume(new ConsumerRecords<>(records));
}
// 根据timeout 参数,计算剩余可用的时间
long elapsed = time.milliseconds() - start;
remaining = timeout - elapsed;
} while (remaining > 0); //在超时时间到达前会一直循环的
从上面代码可以看到,在没有获取到数据的时候同时超时时间到达之前,会反复通过调用 pollonce 方法进行消息的拉取,当 pollonce 方法如果获取到数据的时候,都会接着再新增一个FetchRequest请求,并且发送了这个请求,这是为了下一次poll的时候不需要发送请求直接返回数据。
如果没有数据而且超时时间没到的时候,会一直调用pollonce方法进行一次消息的获取。我们看下KafkaConsumer#pollonce这个方法逻辑。参考代码如下:
private Map<TopicPartition, List<ConsumerRecord<K, V>>> pollOnce(long timeout) {
// 确认服务端的GroupCoordinator可用,以及当前consumer已加入消费者群组
coordinator.poll(time.milliseconds());
//从内存中尝试获取数据
Map<TopicPartition, List<ConsumerRecord<K, V>>> records = fetcher.fetchedRecords();
if (!records.isEmpty())
return records;
// send any new fetches (won't resend pending fetches)
//没有获取到数据,构建请求,将请求对象放入unsent队列。等待发送
fetcher.sendFetches();
//真正请求broker,获取到的数据存入FetchResponse#responseData中
client.poll(pollTimeout, now, new PollCondition() {
@Override
public boolean shouldBlock() {
// since a fetch might be completed by the background thread, we need this poll condition
// to ensure that we do not block unnecessarily in poll()
return !fetcher.hasCompletedFetches();
}
});
//是否有新的consumer加入等需要rebalance
if (coordinator.needRejoin())
return Collections.emptyMap();
//再次从内存尝试获取数据
return fetcher.fetchedRecords();
}
上面说过,我们在KafakaConsumer#poll的时候如果获取到了数据的时候会再发送一次请求,如果这个请求请求到了数据,会将这个数据存在内存中,下一次获取的时候直接调用fetcher.fetchedRecords()方法从内存中获取到数据后返回。
如果这个请求没有返回数据,则再会新增一个请求 (fetcher.sendFetches()) 并发送请求(client.poll),然后再次调用fetcher.fetchedRecords()返回,形成一个循环流程~~。
下面我们分别看下fetcher.sendFetches()、client.poll以及 fetcher.fetchedRecords()这3个方法是如何运行的。
首先看下fetcher.sendFetches()方法,参考代码如下:
public int sendFetches() {
//创建FetchRequests,多个分区首领可能在不同的节点。
Map<Node, FetchRequest.Builder> fetchRequestMap = createFetchRequests();
//根据节点循环,
for(){
//创建ClientRequest节点信息、分区信息等,存入unsent 队列,并不是真正发送。
client.send()
//添加监听信息,等待回调将消息等写入Fetcher#LinkedQueue中。
.addListener()
}
}
将请求进行封装丢进队列中,并且对这个请求加个回调函数方便对请求结果的处理。下一步就是发送这个请求,
2、网络请求
下面我们主要看下这个NetworkClient#poll方法:
public List<ClientResponse> poll(long timeout, long now) {
//元数据更新
long metadataTimeout = metadataUpdater.maybeUpdate(now);
try {
//网络IO进行Select.select
this.selector.poll(Utils.min(timeout, metadataTimeout, requestTimeoutMs));
} catch (IOException e) {
log.error("Unexpected error during I/O", e);
}
// process completed actions
long updatedNow = this.time.milliseconds();
List<ClientResponse> responses = new ArrayList<>();
handleAbortedSends(responses);
//处理已完成的请求
handleCompletedSends(responses, updatedNow);
//处理请求响应的数据、回调那个添加的监听
handleCompletedReceives(responses, updatedNow);
handleDisconnections(responses, updatedNow);
handleConnections();
handleInitiateApiVersionRequests(updatedNow);
handleTimedOutRequests(responses, updatedNow);
}
这个方法所做的事情就是更新元数据信息、网络IO处理、后面几个方法都是用来处理请求后的逻辑的。我们还是往下看selector.poll方法做的什么事情,接着上代码:Select#poll。
public void poll(long timeout) throws IOException {
//Select.select,获取下个事件的类型,读、写、可连接等
int readyKeys = select(timeout);
long endSelect = time.nanoseconds();
this.sensors.selectTime.record(endSelect - startSelect, time.milliseconds());
// 根据不同的事件做对应的事情,参照SelectionKey描述,OP_READ、OP_WRITE、OP_CONNECT、OP_ACCEPT
if (readyKeys > 0 || !immediatelyConnectedKeys.isEmpty()) {
pollSelectionKeys(this.nioSelector.selectedKeys(), false, endSelect);
pollSelectionKeys(immediatelyConnectedKeys, true, endSelect);
}
//如果有数据返回记录到completedReceives中
addToCompletedReceives();
}
这里先是获取当前事件类型。然后根据事件的类型做相应的读写等操作。
private void pollSelectionKeys(Iterable<SelectionKey> selectionKeys,
boolean isImmediatelyConnected,
long currentTimeNanos) {
if (isImmediatelyConnected || key.isConnectable()) {
if (channel.finishConnect()) {
this.connected.add(channel.id());
this.sensors.connectionCreated.record();
SocketChannel socketChannel = (SocketChannel) key.channel();
log.debug("Created socket with SO_RCVBUF = {}, SO_SNDBUF = {}, SO_TIMEOUT = {} to node {}",
socketChannel.socket().getReceiveBufferSize(),
socketChannel.socket().getSendBufferSize(),
socketChannel.socket().getSoTimeout(),
channel.id());
} else
continue;
}
/* if channel is not ready finish prepare */
if (channel.isConnected() && !channel.ready())
channel.prepare();
/* if channel is ready read from any connections that have readable data */
if (channel.ready() && key.isReadable() && !hasStagedReceive(channel)) {
NetworkReceive networkReceive;
while ((networkReceive = channel.read()) != null)
addToStagedReceives(channel, networkReceive);
}
/* if channel is ready write to any sockets that have space in their buffer and for which we have data */
if (channel.ready() && key.isWritable()) {
Send send = channel.write();
if (send != null) {
this.completedSends.add(send);
this.sensors.recordBytesSent(channel.id(), send.size());
}
}
}
}
这个方法就是就是根据不同的key,针对不同的key类型做不同的逻辑处理,是真正将请求发送出去以及接受响应的方法。
具体NIO方面操作就不往下细扒了。我还是回头看下当前请求节点上的channel有可读的数据时,是如何将数据放入Handover 队列里面供下游使用,这里我们看到上述channel.isReadable的时候调用了addToStagedReceives方法,这个方法会将buffer中的数据最终放入Selector# stagedReceives的内存中,而刚才在NetworkClient#poll方法中有个handleCompletedReceives方法,这个方法最终会回调RequestFutureListener#onSuccess() 将消息存入Fetch中的completedFetches。最后被fetcher.fetchedRecords()调用获取。