当前位置:   article > 正文

Kafka 的 ISR 机制_kafka isr原理

kafka isr原理

ISR 是什么

ISR,是 In-Sync Replicas,同步副本的意思
Kafka中,每个主题分区可以有多个副本(replica)。ISR 是与主副本(Leader Replica)保持同步的副本集合。

ISR 的作用

ISR 机制就是用于确保数据的可靠性和一致性的

数据一致性保证:

当消息被写入 Kafka 的分区时,它首先会被写入 Leader,然后 Leader 将消息复制给 ISR 中的所有副本。只有当 ISR 中的所有副本都成功地接收到并确认了消息后,主副本才会认为消息已成功提交。这种机制确保了数据的可靠性和致性。
生产者在写入数据时,可以通过设置 acks 参数来控制数据的一致性级别。设置 acks=all(或acks=-1)

故障容错能力:

如果领导副本发生故障,Kafka 会从 ISR 中选取一个新的领导副本。由于 ISR 中的副本与之前的领导副本保持同步,新的领导副本能够继续提供服务,而不会丢失数据。

ISR 的维护机制

领导副本更新 ISR :

领导副本会定期检查每个追随者副本的状态。如果某个追随者副本在指定时间内未能跟上领导副本的更新,领导副本会将其从 ISR 中移除。

追随者副本重新加入 ISR :

当追随者副本追上了领导副本的日志进度(即达到了与领导副本相同的日志偏移量),领导副本会将其重新加入ISR。

ISR 列表维护

在 Kafka 中,ISR(In-Sync Replicas)列表的维护是通过副本状态配置参数来进行的。具体的 ISR 列表维护机制在不同的 Kafka 版本中有所变化。

before 0.9.x

在 0.9.x 之前的版本,Kafka 有一个核心的参数 :replica.lag.max.messages 表示如果 Follower 落后 Leader 的消息数量超过了这个参数值,就认为 Follower 就会从 ISR 列表里移除。

但是,基于 replica.1ag.max.messages 这种实现,在瞬间高并发访问的情况下会有问题:比如Leader瞬间接收到几万条消息,然后所有 Follower 还没来得及同步过去,此时所有 Follower 都会被踢出 ISR 列表。

after 0.9.x

Kafka 从 0.9.x 版本开始,引入了 replica.1ag.max.ms 参数,表示如果某个 Follower 的 LEO(latest endoffset)一直落后 Leader 超过了10秒,那么才会被从 ISR 列表里移除

这样的话,即使出现瞬间流量,导致 Follower 落后很多数据,但是只要在限定的时间内尽快追上来就行了

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/木道寻08/article/detail/982763
推荐阅读
相关标签
  

闽ICP备14008679号