当前位置:   article > 正文

JAVA面试题分享一百六十三:Kafka如何实现延时推送?_kafkatemplate消息延迟实现

kafkatemplate消息延迟实现

目录

一、延时队列定义

二、技术实现方案

1. Redis

2. Kafka

3. RabbitMQ

4. RocketMQ

三、Kafka延时队列背景

四、Kafka延时队列实现思路

六、Kafka延时队列架构图

七、kafka延时任务代码实现

1. KafkaDelayQueue:Kafka延迟队列

2. KafkaDelayQueueFactory:Kafka延迟队列工厂

3. KafkaPollListener:Kafka延迟队列事件监听

4. KafkaDelayConfig:Kafka延时配置

八. 如何使用kafka延时队列

九、测试

十、总结


一、延时队列定义

延时队列:是一种消息队列,可以用于在指定时间或经过一定时间后执行某种操作。

二、技术实现方案

1. Redis

  1. 1.1 优点:
  2. ①Redis的延迟队列是基于Redis的sorted set实现的,性能较高。
  3. ②Redis的延迟队列可以通过TTL设置过期时间,灵活性较高。
  4. ③简单易用,适用于小型系统。
  5. ④性能较高,支持高并发。
  6. 1.2 缺点:
  7. ①可靠性相对较低,可能会丢失消息,就算redis最高级别的持久化也是有可能丢一条的,每次请求都做aof,但是aof是异步的,所以不保证这一条操作能被持久化。
  8. ②而且Redis持久化的特性也导致其在数据量较大时,存储和查询效率逐渐降低,此时会需要对其进行分片和负载均衡。
  9. ③Redis的延迟队列需要手动实现消息重试机制,更严谨的消息队列需要数据库兜底。
  10. 1.3 应用场景:
  11. ①适用于较小规模的系统,实时性要求较高的场景。
  12. ②适用于轻量级的任务调度和消息通知场景,适合短期延迟任务,不适合长期任务,例如订单超时未支付等。

2. Kafka

  1. 2.1 优点:
  2. ①Kafka的优点在于其高并发、高吞吐量和可扩展性强,同时支持分片。
  3. ②可靠性高,支持分布式和消息持久化。
  4. ③消费者可以随时回溯消费。
  5. ④支持多个消费者并行消费、消费者组等机制。
  6. 2.2 缺点:
  7. ①没有原生的延迟队列功能,需要使用topic和消费者组来实现,实现延迟队列需要额外的开发工作。
  8. ②消费者需要主动拉取数据,可能会导致延迟,精度不是特别高。
  9. 在此案例中代码已经实现了,直接拿来使用就可以了。
  10. 2.3 应用场景:
  11. 适用于大规模的数据处理,实时性要求较高的,高吞吐量的消息处理场景。

3. RabbitMQ

  1. 3.1 优点:
  2. ①RabbitMQ的延迟队列是通过RabbitMQ的插件实现的,易于部署和使用。
  3. ②RabbitMQ的延迟队列支持消息重试和消息顺序处理,可靠性较高。
  4. ③支持消息持久化和分布式。
  5. ④支持优先级队列和死信队列。
  6. ⑤提供了丰富的插件和工具。
  7. 3.2 缺点:
  8. ①RabbitMQ的延迟队列性能较低,不适用于高吞吐量的场景。
  9. ②性能较低,不适合高并发场景。
  10. ③实现延迟队列需要额外的配置,但是配置就很简单了。
  11. 3.3应用场景:
  12. 适用于中小型的任务调度和消息通知,对可靠性要求高的场景。

4. RocketMQ

  1. 4.1 优点:
  2. ①RocketMQ的延迟队列是RocketMQ原生支持的,易于使用和部署。
  3. ②RocketMQ的延迟队列支持消息重试和消息顺序处理,可靠性较高。
  4. ③高性能和高吞吐量,支持分布式和消息持久化。
  5. ④RocketMQ使用简单,性能好,并且支持延迟队列功能。
  6. 4.2 缺点:
  7. ①RocketMQ的延迟队列不支持动态添加或删除队列。
  8. ②RocketMQ的延迟队列需要保证消息的顺序,可能会导致消息延迟。
  9. ③在节点崩溃后,RocketMQ有可能发生消息丢失。
  10. 4.3 应用场景:
  11. ①适用于大规模的数据处理,对性能和吞吐量要求较高的场景。
  12. ②适合于任务量较大、需要延迟消息和定时消息的场景。例如电商平台、社交软件等。
  13. ③适用于分布式任务调度和高可靠性消息通知场景。

三、Kafka延时队列背景

  1. 基于以上四种实现延时队列的分析来,选择对应的技术方案的基础上呢,不同公司的mq的基础设施不同,如果只有Kafka,也没必要引入RabbitMQ和RocketMq来实现,引入新的组件也会顺便带来新的问题。

  2. 网上搜Kafka实现延时队列有很多文章,很多文章说使用Kafka内部的时间轮,支持延时操作,但这是Kafka自己内部使用的,时间轮只是一个工具类,用户无法将其作为延迟队列来使用。

  3. Kafka延时队列的最佳实践,使用Kafka消费者的暂停和恢复机制来实现

四、Kafka延时队列实现思路

  1. 解决一个问题前首先要明确问题,如何让Kafka有延时队列的功能呢?
  2. 就是在Kafka消费者消费的时候延时消费,不久搞定了嘛
  3. 那如何延时消费呢,网上有些文章使用Thread.sleep进行延时消费这是不靠谱的(亲身实践),sleep的时间超过了Kafka配置的max.poll.records时间,消费者无法及时提交offset,kafka就会认为这个消费者已经挂了,会进行rebalance也就是重新分配分区给消费者,以保证每个分区只被一个消费者消费
  4. 也有同学说了,为了不发生rebalance,那可以增加max.poll.records时间啊,但是这样的话,如果要sleep几天的时间,难道max.poll.records要写几天的时间嘛,有违Kafka的设计原理了,那怎么办呢?
  5. 这时候Kafka的pause暂停消费和resume恢复消费就登场了,pause暂停某个分区之后消费者不会再poll拉取该分区的消息,直到resume恢复该分区之后才会重新poll消息。
  6. 我已经做好了Kafka延时队列的封装,以后只需要一行代码就可以实现延时队列了,代码核心使用Kafka消费者的pause函数(暂停)和resume函数(恢复)+线程池+定时任务+事件监听机制+工厂模式

六、Kafka延时队列架构图

七、kafka延时任务代码实现

以下代码只列出了核心实现

1. KafkaDelayQueue:Kafka延迟队列

定义一个Kafka延期队列,包含的内容:KafkaDelayQueue,其中有延迟队列配置,主题,消费组,延迟时间,目标主题,KafkaSyncConsumer,ApplicationContext,poll线程池,delay线程池等等

  1. package com.wdyin.kafka.delay;
  2. import lombok.Getter;
  3. import lombok.Setter;
  4. import lombok.extern.slf4j.Slf4j;
  5. import org.apache.kafka.clients.consumer.ConsumerRecords;
  6. import org.apache.kafka.common.TopicPartition;
  7. import org.slf4j.Logger;
  8. import org.slf4j.LoggerFactory;
  9. import org.springframework.context.ApplicationContext;
  10. import org.springframework.scheduling.concurrent.ThreadPoolTaskScheduler;
  11. import java.time.Duration;
  12. import java.util.Collections;
  13. import java.util.concurrent.ThreadPoolExecutor;
  14. /**
  15. * kafka延时队列
  16. *
  17. **/
  18. @Slf4j
  19. @Getter
  20. @Setter
  21. class KafkaDelayQueue<K, V> {
  22. private String topic;
  23. private String group;
  24. private Integer delayTime;
  25. private String targetTopic;
  26. private KafkaDelayConfig kafkaDelayConfig;
  27. private KafkaSyncConsumer<K, V> kafkaSyncConsumer;
  28. private ApplicationContext applicationContext;
  29. private ThreadPoolTaskScheduler threadPoolPollTaskScheduler;
  30. private ThreadPoolTaskScheduler threadPoolDelayTaskScheduler;
  31. ......
  32. }

2. KafkaDelayQueueFactory:Kafka延迟队列工厂

Kafka延期队列的工厂,用于及其管理延迟队列

  1. package com.wdyin.kafka.delay;
  2. import lombok.Data;
  3. import org.apache.kafka.clients.consumer.ConsumerConfig;
  4. import org.springframework.context.ApplicationContext;
  5. import org.springframework.util.Assert;
  6. import org.springframework.util.StringUtils;
  7. import java.util.Properties;
  8. /**
  9. * 延时队列工厂
  10. **/
  11. @Data
  12. public class KafkaDelayQueueFactory {
  13. private KafkaDelayConfig kafkaDelayConfig;
  14. private Properties properties;
  15. private ApplicationContext applicationContext;
  16. private Integer concurrency;
  17. public KafkaDelayQueueFactory(Properties properties, KafkaDelayConfig kafkaDelayConfig) {
  18. Assert.notNull(properties, "properties cannot null");
  19. Assert.notNull(kafkaDelayConfig.getDelayThreadPool(), "delayThreadPool cannot null");
  20. Assert.notNull(kafkaDelayConfig.getPollThreadPool(), "pollThreadPool cannot null");
  21. Assert.notNull(kafkaDelayConfig.getPollInterval(), "pollInterval cannot null");
  22. Assert.notNull(kafkaDelayConfig.getPollTimeout(), "timeout cannot null");
  23. this.properties = properties;
  24. this.kafkaDelayConfig = kafkaDelayConfig;
  25. }
  26. public void listener(String topic, String group, Integer delayTime, String targetTopic) {
  27. if (StringUtils.isEmpty(topic)) {
  28. throw new RuntimeException("topic cannot empty");
  29. }
  30. if (StringUtils.isEmpty(group)) {
  31. throw new RuntimeException("group cannot empty");
  32. }
  33. if (StringUtils.isEmpty(delayTime)) {
  34. throw new RuntimeException("delayTime cannot empty");
  35. }
  36. if (StringUtils.isEmpty(targetTopic)) {
  37. throw new RuntimeException("targetTopic cannot empty");
  38. }
  39. KafkaSyncConsumer<String, String> kafkaSyncConsumer = createKafkaSyncConsumer(group);
  40. KafkaDelayQueue<String, String> kafkaDelayQueue = createKafkaDelayQueue(topic, group, delayTime, targetTopic, kafkaSyncConsumer);
  41. kafkaDelayQueue.send();
  42. }
  43. private KafkaDelayQueue<String, String> createKafkaDelayQueue(String topic, String group, Integer delayTime, String targetTopic, KafkaSyncConsumer<String, String> kafkaSyncConsumer) {
  44. KafkaDelayQueue<String, String> kafkaDelayQueue = new KafkaDelayQueue<>(kafkaSyncConsumer, kafkaDelayConfig);
  45. Assert.notNull(applicationContext, "kafkaDelayQueue need applicationContext");
  46. kafkaDelayQueue.setApplicationContext(applicationContext);
  47. kafkaDelayQueue.setDelayTime(delayTime);
  48. kafkaDelayQueue.setTopic(topic);
  49. kafkaDelayQueue.setGroup(group);
  50. kafkaDelayQueue.setTargetTopic(targetTopic);
  51. return kafkaDelayQueue;
  52. }
  53. private KafkaSyncConsumer<String, String> createKafkaSyncConsumer(String group) {
  54. properties.put(ConsumerConfig.GROUP_ID_CONFIG, group);
  55. return new KafkaSyncConsumer<>(properties);
  56. }
  57. }

3. KafkaPollListener:Kafka延迟队列事件监听

  1. package com.wdyin.kafka.delay;
  2. import lombok.extern.slf4j.Slf4j;
  3. import org.apache.kafka.clients.consumer.ConsumerRecord;
  4. import org.apache.kafka.clients.consumer.ConsumerRecords;
  5. import org.apache.kafka.clients.consumer.OffsetAndMetadata;
  6. import org.apache.kafka.common.TopicPartition;
  7. import org.springframework.context.ApplicationListener;
  8. import org.springframework.kafka.core.KafkaTemplate;
  9. import java.time.Instant;
  10. import java.time.LocalDateTime;
  11. import java.time.ZoneId;
  12. import java.util.*;
  13. /**
  14. * 延时队列监听
  15. * @Desc :
  16. */
  17. @Slf4j
  18. public class KafkaPollListener<K, V> implements ApplicationListener<KafkaPollEvent<K, V>> {
  19. private KafkaTemplate kafkaTemplate;
  20. public KafkaPollListener(KafkaTemplate kafkaTemplate) {
  21. this.kafkaTemplate = kafkaTemplate;
  22. }
  23. @Override
  24. public void onApplicationEvent(KafkaPollEvent<K, V> event) {
  25. ConsumerRecords<K, V> records = (ConsumerRecords<K, V>) event.getSource();
  26. Integer delayTime = event.getDelayTime();
  27. KafkaDelayQueue<K, V> kafkaDelayQueue = event.getKafkaDelayQueue();
  28. KafkaSyncConsumer<K, V> kafkaSyncConsumer = kafkaDelayQueue.getKafkaSyncConsumer();
  29. Set<TopicPartition> partitions = records.partitions();
  30. Map<TopicPartition, OffsetAndMetadata> commitMap = new HashMap<>();
  31. partitions.forEach((partition) -> {
  32. List<ConsumerRecord<K, V>> consumerRecords = records.records(partition);
  33. for (ConsumerRecord<K, V> record : consumerRecords) {
  34. long startTime = (record.timestamp() / 1000) * 1000;
  35. long endTime = startTime + delayTime;
  36. long now = System.currentTimeMillis();
  37. if (endTime > now) {
  38. kafkaSyncConsumer.pauseAndSeek(partition, record.offset());
  39. kafkaDelayQueue.getThreadPoolPollTaskScheduler().schedule(kafkaDelayQueue.delayTask(partition), new Date(endTime));
  40. break;
  41. }
  42. log.info("{}: partition:{}, offset:{}, key:{}, value:{}, messageDate:{}, nowDate:{}, messageDate:{}, nowDate:{}",
  43. Thread.currentThread().getName() + "#" + Thread.currentThread().getId(), record.topic() + "-" + record.partition(), record.offset(), record.key(), record.value(), LocalDateTime.ofInstant(Instant.ofEpochMilli(startTime), ZoneId.systemDefault()), LocalDateTime.now(), startTime, Instant.now().getEpochSecond());
  44. kafkaTemplate.send(kafkaDelayQueue.getTargetTopic(), record.value());
  45. commitMap.put(partition, new OffsetAndMetadata(record.offset() + 1));
  46. }
  47. });
  48. if (!commitMap.isEmpty()) {
  49. kafkaSyncConsumer.commit(commitMap);
  50. }
  51. }
  52. }

4. KafkaDelayConfig:Kafka延时配置

  1. package com.wdyin.kafka.delay;
  2. import lombok.Data;
  3. /**
  4. * 延时队列配置
  5. **/
  6. @Data
  7. public class KafkaDelayConfig {
  8. private Integer pollInterval;
  9. private Integer pollTimeout;
  10. private Integer pollThreadPool;
  11. private Integer delayThreadPool;
  12. public KafkaDelayConfig() {
  13. }
  14. ......
  15. }

八. 如何使用kafka延时队列

  1. import org.springframework.stereotype.Component;
  2. import javax.annotation.PostConstruct;
  3. import javax.annotation.Resource;
  4. /**
  5. **/
  6. @Component
  7. public class KafkaDelayApplication {
  8. @Resource
  9. private KafkaDelayQueueFactory kafkaDelayQueueFactory;
  10. /**
  11. * 延迟任务都可以配置在这里
  12. * Kafka将消息从【延时主题】经过【延时时间】后发送到【目标主题】
  13. */
  14. @PostConstruct
  15. public void init() {
  16. //延迟30秒
  17. kafkaDelayQueueFactory.listener("delay-30-second-topic", "delay-30-second-group", 1 * 30 * 1000, "delay-60-second-target-topic");
  18. //延迟60秒
  19. kafkaDelayQueueFactory.listener("delay-60-second-topic", "delay-60-second-group", 1 * 60 * 1000, "delay-60-second-target-topic");
  20. //延迟30分钟
  21. kafkaDelayQueueFactory.listener("delay-30-minute-topic", "delay-30-minute-group", 30 * 60 * 1000, "delay-30-minute-target-topic");
  22. }
  23. }

九、测试

  1. 先往延时主题【delay-60-second-topic】发送一千条消息,一共10个分区,每个分区100条消息,消息时间是2023-04-21 16:37:26分,延迟消息消费时间就应该是2023-04-21 16:38:26
    在这里插入图片描述
  2. 延时队列进行消费:通过日志查看,消息日期和延迟队列消费消息时间正好相差一分钟
    在这里插入图片描述

十、总结

  1. 本案例已成功实现Kafka的延时队列,并进行实测,代码引入可用非常方便。
  2. Kafka实现的延时队列支持秒级别的延时任务,不支持毫秒级别,但是毫秒级别的延时任务也没有意义
  3. 注意一个主题对应的延时时间是一致的,不能在同一个主题里放不同时间的延时任务。
  4. 此方案的缺点就是,如果数据量极大,生产者生产消息速度很快,一定要保证Kafka的消费能力,否则可能会导致延迟,精度不是特别高,不过如果延迟秒级的任务,差个几毫秒肯定可以接受的,一般场景肯定满足。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/497151
推荐阅读
相关标签
  

闽ICP备14008679号