当前位置:   article > 正文

Kafka生产者源码解析(二)——RecordAccumulator_recordaccumulator append方法

recordaccumulator append方法

在上一篇中介绍了KafkaProducer的构造方法及send核心方法,其中在send方法中涉及到将消息追加入RecordAccumulator消息累加器的过程,本篇重点将围绕RecordAccumulator来分析这一过程。

对于Spring-Kafka生产者源码将分成三个部分进行分析:KafkaProducer分析、RecordAccumulator分析、Sender线程分析。本篇是第二部分RecordAccumulator分析。

Spring-Kafka生产者源码解析(一)——KafkaProducer

Spring-Kafka生产者源码解析(二)——RecordAccumulator

Spring-Kafka生产者源码解析(三)——Sender

目录

一、RecordAccumulator的结构

二、append方法解析

三、总结


 RecordAccumulator可以理解为主线程与Sender线程之间的一个缓冲区,在异步发送消息的过程中,主线程将消息存入到RecordAccumulator中后返回,然后满足一定条件时Sender线程再从RecordAccumulator中取出消息进行发送,为了能够很好的理解消息存入RecordAccumulator这一过程,我们先来了解一下RecordAccumulator的结构。

一、RecordAccumulator的结构

进入RecordAccumulator类中,可以看到它有很多的属性字段,其中batches这个字段需要引起我们的注意,它是一个以TopicPartition作为key,Deque<ProducerBatch>作为value的ConcurrentMap,TopicPartition存储了topic及partition信息,能够标记消息属于哪个主题和应该发往哪个分区;Deque是一个双端队列,里面存放的是ProducerBatch对象,ProducerBatch用于存储一批将要被发送的消息记录;ProducerBatch通过MemoryRecordsBuilder对象拥有一个DataOutputStream对象的引用,这里就是我们消息存放的最终归宿,根据MemoryRecordsBuilder构造方法的源码可知DataOutputStream里面持有ByteBufferOutputStream,这是一个缓存buffer,所以往DataOutputStream里面写消息数据,就是往缓存里面写消息数据。

 

最后存入RecordAccumulator中的消息将会是这样。

 

二、append方法解析

RecordAccumulator的构造方法中通过CopyOnWriteMap初始化了上述谈到的batches对象,同时还初始化了其他的属性内容,这里不再赘述其构造的过程,而是着重分析上一篇中遗留的内容:KafkaProducer是如何通过accumulator.append方法将消息追加到RecordAccumulator消息累加器中的

  1. public RecordAppendResult append(TopicPartition tp,
  2. long timestamp,
  3. byte[] key,
  4. byte[] value,
  5. Header[] headers,
  6. Callback callback,
  7. long maxTimeToBlock) throws InterruptedException {
  8. //并发数加1,统计正在向RecordAccumulator中追加消息的线程数
  9. appendsInProgress.incrementAndGet();
  10. ByteBuffer buffer = null;
  11. if (headers == null) headers = Record.EMPTY_HEADERS;
  12. try {
  13. //查找TopicPartition对应的Deque,如果没有则创建
  14. Deque<ProducerBatch> dq = getOrCreateDeque(tp);
  15. //追加消息时需要加锁
  16. synchronized (dq) {
  17. if (closed)
  18. throw new KafkaException("Producer closed while send in progress");
  19. //尝试往Deque中最后一个ProducerBatch中追加消息记录
  20. RecordAppendResult appendResult = tryAppend(timestamp, key, value, headers, callback, dq);
  21. if (appendResult != null)
  22. //消息追加成功返回结果
  23. return appendResult;
  24. }
  25. //来到这一步说明上面消息追加失败
  26. byte maxUsableMagic = apiVersions.maxUsableProduceMagic();
  27. //获取要创建的ProducerBatch的内存大小
  28. int size = Math.max(this.batchSize, AbstractRecords.estimateSizeInBytesUpperBound(maxUsableMagic, compression, key, value, headers));
  29. log.trace("Allocating a new {} byte message buffer for topic {} partition {}", size, tp.topic(), tp.partition());
  30. //从BufferPool中申请空间用于后面创建新的ProducerBatch
  31. buffer = free.allocate(size, maxTimeToBlock);
  32. //和上面一样,追加消息时需要加锁
  33. synchronized (dq) {
  34. // Need to check if producer is closed again after grabbing the dequeue lock.
  35. if (closed)
  36. throw new KafkaException("Producer closed while send in progress");
  37. //在创建新的ProducerBatch之前再次尝试往Deque中最后一个ProducerBatch中追加消息记录,说不定现在成功了呢
  38. RecordAppendResult appendResult = tryAppend(timestamp, key, value, headers, callback, dq);
  39. if (appendResult != null) {
  40. //消息追加成功返回结果
  41. return appendResult;
  42. }
  43. //如果消息还是追加失败了。。。
  44. //构造MemoryRecordsBuilder,消息将会存入它拥有的MemoryRecords对象
  45. MemoryRecordsBuilder recordsBuilder = recordsBuilder(buffer, maxUsableMagic);
  46. //创建ProducerBatch
  47. ProducerBatch batch = new ProducerBatch(tp, recordsBuilder, time.milliseconds());
  48. //使用batch.tryAppend追加消息
  49. FutureRecordMetadata future = Utils.notNull(batch.tryAppend(timestamp, key, value, headers, callback, time.milliseconds()));
  50. //将刚创建的ProducerBatch放入Deque双端队列尾部
  51. dq.addLast(batch);
  52. incomplete.add(batch);
  53. //到这里消息已经追加成功,将buffer置空
  54. buffer = null;
  55. //返回结果
  56. return new RecordAppendResult(future, dq.size() > 1 || batch.isFull(), true);
  57. }
  58. } finally {
  59. if (buffer != null)
  60. //释放之前申请的新空间
  61. free.deallocate(buffer);
  62. //结束,并发数减1
  63. appendsInProgress.decrementAndGet();
  64. }
  65. }

上面的代码已经给出了注释,现将这段代码的流程总结如下:

  1. 首先根据TopicPartition参数获取到对应的Deque双端队列,没有则创建。

  2. 使用Synchronized关键字对追加消息的操作加锁。

  3. 调用tryAppend方法尝试往Deque中最后一个ProducerBatch中追加消息记录,如果成功则返回RecordAppendResult结果,Synchronized解锁。

  4. 如果上面追加消息失败,则从BufferPool中申请新的空间用于后面创建新的ProducerBatch。

  5. 使用Synchronized关键字对追加消息的操作加锁,然后再次尝试第三步。

  6. 到这一步说明上面的第二次尝试仍然没有成功,那么使用第四步申请到的空间创建新的ProducerBatch。

  7. 将消息记录追加到新建的ProducerBatch中,然后将新建的ProducerBatch插入到Deque双端队列尾部,并将它放入incomplete集合。

  8. 最后Synchronized解锁,到这里消息追加已经成功,返回RecordAppendResult结果,它将作为唤醒Sender线程的条件。

这段代码的核心部分便是batch.tryAppend方法,下面是该方法的部分源码,首先是检查了一下消息存储器的剩余空间是否充足,若不足则直接返回null,后面走申请空间新建ProducerBatch的流程。如果空间剩余充足则MemoryRecordsBuilder会调用append方法进行消息追加。

  1. public FutureRecordMetadata tryAppend(long timestamp, byte[] key, byte[] value, Header[] headers, Callback callback, long now) {
  2. //检查消息存储器中剩余空间是否充足,若空间不足则直接返回null
  3. if (!recordsBuilder.hasRoomFor(timestamp, key, value, headers)) {
  4. return null;
  5. } else {
  6. //消息写入
  7. Long checksum = this.recordsBuilder.append(timestamp, key, value, headers);
  8. ……………………
  9. return future;
  10. }
  11. }

然后像洋葱一样不断剥开append方法的皮,,,,,发现MemoryRecordsBuilder最终会根据KafkaProducer客户端版本的不同去调用下面两个方法之一:appendDefaultRecord和appendLegacyRecord。

  1. private void appendDefaultRecord(long offset, long timestamp, ByteBuffer key, ByteBuffer value,
  2. Header[] headers) throws IOException {
  3. ………………
  4. int sizeInBytes = DefaultRecord.writeTo(appendStream, offsetDelta, timestampDelta, key, value, headers);
  5. recordWritten(offset, timestamp, sizeInBytes);
  6. }
  7. private long appendLegacyRecord(long offset, long timestamp, ByteBuffer key, ByteBuffer value) throws IOException {
  8. ………………
  9. long crc = LegacyRecord.write(appendStream, magic, timestamp, key, value, CompressionType.NONE, timestampType);
  10. recordWritten(offset, timestamp, size + Records.LOG_OVERHEAD);
  11. return crc;
  12. }

它们分别通过DefaultRecord.writeTo和LegacyRecord.write去实现最终的消息追加,它们的第一个参数就是一开始所谈到的DataOutputStream对象,DataOutputStream里面持有ByteBufferOutputStream,这是一个缓存buffer,所以往DataOutputStream里面写消息数据,就是往缓存里面写消息数据,后面的recordWritten方法主要是处理位移问题。

下面主要以writeTo方法源码为例来看下其最终处理逻辑:

  1. public static int writeTo(DataOutputStream out,
  2. int offsetDelta,
  3. long timestampDelta,
  4. ByteBuffer key,
  5. ByteBuffer value,
  6. Header[] headers) throws IOException {
  7. //计算消息数据大小
  8. int sizeInBytes = sizeOfBodyInBytes(offsetDelta, timestampDelta, key, value, headers);
  9. //写入消息数据大小
  10. ByteUtils.writeVarint(sizeInBytes, out);
  11. ……………………
  12. //写入key值
  13. if (key == null) {
  14. ByteUtils.writeVarint(-1, out);
  15. } else {
  16. int keySize = key.remaining();
  17. ByteUtils.writeVarint(keySize, out);
  18. Utils.writeTo(out, key, keySize);
  19. }
  20. //写入value值
  21. if (value == null) {
  22. ByteUtils.writeVarint(-1, out);
  23. } else {
  24. int valueSize = value.remaining();
  25. ByteUtils.writeVarint(valueSize, out);
  26. Utils.writeTo(out, value, valueSize);
  27. }
  28. if (headers == null)
  29. throw new IllegalArgumentException("Headers cannot be null");
  30. ByteUtils.writeVarint(headers.length, out);
  31. //循环headers写入
  32. for (Header header : headers) {
  33. …………………………
  34. }
  35. //返回总数据的大小
  36. return ByteUtils.sizeOfVarint(sizeInBytes) + sizeInBytes;
  37. }

到这里追加消息记录到RecordAccumulator消息累加器中的流程结束。

三、总结

本篇主要是对RecordAccumulator的结构及append方法进行了分析,KafkaProducer将消息不断的暂存入RecordAccumulator之中,当满足了一定的条件后,将会触发唤醒Sender线程,而Sender线程的主要工作就是把RecordAccumulator中的消息通过网络I/O发送出去,至于满足什么样的条件以及Sender线程具体是如何工作的将会放在第三篇进行分析。

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/618404
推荐阅读
相关标签
  

闽ICP备14008679号