赞
踩
重复是指发生重试造成的重复
解决kafka数据重复:幂等性 + ack-1 + 事务
(1)设置ack应答级别为-1,分区副本个数大于等于2,ISR应答队列中的最小副本数量大于等于2
(2)开启幂等性
(3)开启事务
(4)如果还存在重复,那就在kafka传送的目的地进行去重:spark、redis或者hive等
注意:事务和幂等性是在kafka0.11版本之后才有,企业常用0.10版本,故可以采用第(1)(4)点进行去重
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。