赞
踩
项目运行初期,kafka收集数据量不大,数据实时性要求不高,慢慢消费也会消费完,随着使用者和使用量的增加,数据增长过快,默认的配置无法在kafka配置默认的时间消费完数据,从而使得数据回滚,造成数据堆积导致重复消费。
其实主要原因是我消费者接受的方法执行时间过长,无法优化,每进来一条数据需要执行大概4~5秒。
根据自己环境添加如下配置max.poll.records
,此处配置的含义是,30个数据做一次poll提交,不配置的话默认是500个。
还有个很关键的参数max.poll.interval.ms
默认值是300000,也就是5分钟,用途是一次提交需要在5分钟内完成,因为原先max.poll.records
在默认情况下500个做一次提交,但是我方法一次需要执行5秒左右,根本来不及,所以数据回滚堆积了。
现在配置成30x5秒=2.5分钟,在5分钟内提交,至此问题即可解决。因为使用的spring-kafka版本较低,无法配置max.poll.interval.ms
参数,在不升级版本的情况下就无法做修改了,如果版本支持,直接把这个参数配置调大也是可以的,默认500一次提交,500x5秒≈42分钟,单线程下原则上把max.poll.interval.ms
设置大于42分钟即可。
#项目配置文件的本地配置,根据自己项目实际情况配置
kafka:
consumer:
max:
poll:
records: 30
用的是spring-kafka的@KafkaListener注解接收数据,自定义配置如下
kafka: consumer: zookeeper: connect: 116.1.2.3:2181 servers: 116.1.2.3:9092 enable: auto: commit: false session: timeout: 10000 auto: commit: interval: 100 offset: reset: latest topic: test group: id: test concurrency: 5 producer: servers: 116.1.2.3:9092 retries: 0 batch: size: 4096 linger: 1 buffer: memory: 40960
import org.apache.kafka.clients.consumer.ConsumerConfig; import org.apache.kafka.common.serialization.StringDeserializer; import org.springframework.beans.factory.annotation.Value; import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import org.springframework.kafka.annotation.EnableKafka; import org.springframework.kafka.config.ConcurrentKafkaListenerContainerFactory; import org.springframework.kafka.config.KafkaListenerContainerFactory; import org.springframework.kafka.core.ConsumerFactory; import org.springframework.kafka.core.DefaultKafkaConsumerFactory; import org.springframework.kafka.listener.ConcurrentMessageListenerContainer; import java.util.HashMap; import java.util.Map; @Configuration @EnableKafka public class KafkaConsumerConfig { @Value("${kafka.consumer.servers}") private String servers; @Value("${kafka.consumer.enable.auto.commit}") private boolean enableAutoCommit; @Value("${kafka.consumer.session.timeout}") private String sessionTimeout; @Value("${kafka.consumer.auto.commit.interval}") private String autoCommitInterval; @Value("${kafka.consumer.group.id}") private String groupId; @Value("${kafka.consumer.auto.offset.reset}") private String autoOffsetReset; @Value("${kafka.consumer.concurrency}") private int concurrency; @Value("${kafka.consumer.max.poll.records}") private int records; @Bean public KafkaListenerContainerFactory<ConcurrentMessageListenerContainer<String, String>> kafkaListenerContainerFactory() { ConcurrentKafkaListenerContainerFactory<String, String> factory = new ConcurrentKafkaListenerContainerFactory<>(); factory.setConsumerFactory(consumerFactory()); factory.setConcurrency(concurrency); factory.getContainerProperties().setPollTimeout(1500); return factory; } public ConsumerFactory<String, String> consumerFactory() { return new DefaultKafkaConsumerFactory<>(consumerConfigs()); } public Map<String, Object> consumerConfigs() { Map<String, Object> propsMap = new HashMap<>(); propsMap.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, servers); propsMap.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, enableAutoCommit); propsMap.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, autoCommitInterval); propsMap.put(ConsumerConfig.SESSION_TIMEOUT_MS_CONFIG, sessionTimeout); propsMap.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class); propsMap.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class); propsMap.put(ConsumerConfig.GROUP_ID_CONFIG, groupId); propsMap.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, autoOffsetReset); propsMap.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, records); return propsMap; } }
import org.apache.kafka.clients.producer.ProducerConfig; import org.apache.kafka.common.serialization.StringSerializer; import org.springframework.beans.factory.annotation.Value; import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import org.springframework.kafka.annotation.EnableKafka; import org.springframework.kafka.core.DefaultKafkaProducerFactory; import org.springframework.kafka.core.KafkaTemplate; import org.springframework.kafka.core.ProducerFactory; import java.util.HashMap; import java.util.Map; @Configuration @EnableKafka public class KafkaProducerConfig { @Value("${kafka.producer.servers}") private String servers; @Value("${kafka.producer.retries}") private int retries; @Value("${kafka.producer.batch.size}") private int batchSize; @Value("${kafka.producer.linger}") private int linger; @Value("${kafka.producer.buffer.memory}") private int bufferMemory; public Map<String, Object> producerConfigs() { Map<String, Object> props = new HashMap<>(); props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, servers); props.put(ProducerConfig.RETRIES_CONFIG, retries); props.put(ProducerConfig.BATCH_SIZE_CONFIG, batchSize); props.put(ProducerConfig.LINGER_MS_CONFIG, linger); props.put(ProducerConfig.BUFFER_MEMORY_CONFIG, bufferMemory); props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class); props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class); return props; } public ProducerFactory<String, String> producerFactory() { return new DefaultKafkaProducerFactory<>(producerConfigs()); } @Bean public KafkaTemplate<String, String> kafkaTemplate() { return new KafkaTemplate<String, String>(producerFactory()); } }
import lombok.extern.slf4j.Slf4j; import org.apache.kafka.clients.consumer.ConsumerRecord; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.kafka.annotation.KafkaListener; import org.springframework.kafka.core.KafkaTemplate; import org.springframework.kafka.support.SendResult; import org.springframework.stereotype.Service; import org.springframework.util.concurrent.ListenableFuture; @Slf4j @Service public class TestService { @Autowired private KafkaTemplate<String, String> kafkaTemplate; /** * 消费消息 */ @KafkaListener(topics = {"test"}) public void addOrUpdateToTpkByKafka(ConsumerRecord<String, String> record) { //模拟实际业务消费单条消息需要五秒左右,此处线程等待五秒 try { Thread.sleep(5000); } catch (InterruptedException e) { e.printStackTrace(); } String key = record.key(); String value = record.value(); log.info("接收的数据是:{}", value); } /** * 生产消息 */ public void sendKafkaMessage() { for (int i = 0; i < 50; i++){ ListenableFuture<SendResult<String, String>> future = kafkaTemplate.send("test", "keyValue", "data" + i); try { SendResult<String, String> sendResult = future.get(); future.addCallback( SuccessCallback -> log.info("kafka Producer发送消息成功!topic=" + sendResult.getRecordMetadata().topic() + ",partition=" + sendResult.getRecordMetadata().partition() + ",offset=" + sendResult.getRecordMetadata().offset()), FailureCallback -> log.error("kafka Producer发送消息失败!sendResult=" + com.alibaba.fastjson.JSONObject.toJSONString(sendResult.getProducerRecord()))); } catch (Exception e) { e.printStackTrace(); } } } }
#################consumer的配置参数(开始)################# #如果'enable.auto.commit'为true,则消费者偏移自动提交给Kafka的频率(以毫秒为单位),默认值为5000。 spring.kafka.consumer.auto-commit-interval; #当Kafka中没有初始偏移量或者服务器上不再存在当前偏移量时该怎么办,默认值为latest,表示自动将偏移重置为最新的偏移量 #可选的值为latest, earliest, none spring.kafka.consumer.auto-offset-reset=latest; #以逗号分隔的主机:端口对列表,用于建立与Kafka群集的初始连接。 spring.kafka.consumer.bootstrap-servers; #ID在发出请求时传递给服务器;用于服务器端日志记录。 spring.kafka.consumer.client-id; #如果为true,则消费者的偏移量将在后台定期提交,默认值为true spring.kafka.consumer.enable-auto-commit=true; #如果没有足够的数据立即满足“fetch.min.bytes”给出的要求,服务器在回答获取请求之前将阻塞的最长时间(以毫秒为单位) #默认值为500 spring.kafka.consumer.fetch-max-wait; #服务器应以字节为单位返回获取请求的最小数据量,默认值为1,对应的kafka的参数为fetch.min.bytes。 spring.kafka.consumer.fetch-min-size; #用于标识此使用者所属的使用者组的唯一字符串。 spring.kafka.consumer.group-id; #心跳与消费者协调员之间的预期时间(以毫秒为单位),默认值为3000 spring.kafka.consumer.heartbeat-interval; #密钥的反序列化器类,实现类实现了接口org.apache.kafka.common.serialization.Deserializer spring.kafka.consumer.key-deserializer=org.apache.kafka.common.serialization.StringDeserializer #值的反序列化器类,实现类实现了接口org.apache.kafka.common.serialization.Deserializer spring.kafka.consumer.value-deserializer=org.apache.kafka.common.serialization.StringDeserializer #一次调用poll()操作时返回的最大记录数,默认值为500 spring.kafka.consumer.max-poll-records; #################consumer的配置参数(结束)################# #################producer的配置参数(开始)################# #procedure要求leader在考虑完成请求之前收到的确认数,用于控制发送记录在服务端的持久化,其值可以为如下: #acks = 0 如果设置为零,则生产者将不会等待来自服务器的任何确认,该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下,无法保证服务器已收到记录,并且重试配置将不会生效(因为客户端通常不会知道任何故障),为每条记录返回的偏移量始终设置为-1。 #acks = 1 这意味着leader会将记录写入其本地日志,但无需等待所有副本服务器的完全确认即可做出回应,在这种情况下,如果leader在确认记录后立即失败,但在将数据复制到所有的副本服务器之前,则记录将会丢失。 #acks = all 这意味着leader将等待完整的同步副本集以确认记录,这保证了只要至少一个同步副本服务器仍然存活,记录就不会丢失,这是最强有力的保证,这相当于acks = -1的设置。 #可以设置的值为:all, -1, 0, 1 spring.kafka.producer.acks=1 #每当多个记录被发送到同一分区时,生产者将尝试将记录一起批量处理为更少的请求, #这有助于提升客户端和服务器上的性能,此配置控制默认批量大小(以字节为单位),默认值为16384 spring.kafka.producer.batch-size=16384 #以逗号分隔的主机:端口对列表,用于建立与Kafka群集的初始连接 spring.kafka.producer.bootstrap-servers #生产者可用于缓冲等待发送到服务器的记录的内存总字节数,默认值为33554432 spring.kafka.producer.buffer-memory=33554432 #ID在发出请求时传递给服务器,用于服务器端日志记录 spring.kafka.producer.client-id #生产者生成的所有数据的压缩类型,此配置接受标准压缩编解码器('gzip','snappy','lz4'), #它还接受'uncompressed'以及'producer',分别表示没有压缩以及保留生产者设置的原始压缩编解码器, #默认值为producer spring.kafka.producer.compression-type=producer #key的Serializer类,实现类实现了接口org.apache.kafka.common.serialization.Serializer spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.StringSerializer #值的Serializer类,实现类实现了接口org.apache.kafka.common.serialization.Serializer spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer #如果该值大于零时,表示启用重试失败的发送次数 spring.kafka.producer.retries #################producer的配置参数(结束)################# #################listener的配置参数(结束)################# #侦听器的AckMode,参见https://docs.spring.io/spring-kafka/reference/htmlsingle/#committing-offsets #当enable.auto.commit的值设置为false时,该值会生效;为true时不会生效 spring.kafka.listener.ack-mode; #在侦听器容器中运行的线程数 spring.kafka.listener.concurrency; #轮询消费者时使用的超时(以毫秒为单位) spring.kafka.listener.poll-timeout; #当ackMode为“COUNT”或“COUNT_TIME”时,偏移提交之间的记录数 spring.kafka.listener.ack-count; #当ackMode为“TIME”或“COUNT_TIME”时,偏移提交之间的时间(以毫秒为单位) spring.kafka.listener.ack-time; #################listener的配置参数(结束)#################
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。