赞
踩
kafka的leader和follower是相对于分区有意义的,不是相对于broker。
因为每个分区都有leader和follower,
leader负责读写数据。
follower负责复制leader的数据保存到自己的日志数据中,并在leader挂掉后重新选举出leader。
kafka会再创建topic的时候尽量让分配分区的leader在不同的broker中,就是负载均衡。
zookeeper的leader负责读写,follower可以读取。
kafka的leader负责读写,follower不能读写数据(确保每个消费者消费的数据是一致的),kafka一个topic有多个分区leader,一样可以实现负载均衡。
kafka的follower可以分为三类:AR ISR OSR
AR=ISR+OSR
使用Kafka Eagle查看某个Topic的partition的ISR有哪几个节点。
partition是创建的topic为test的 0 1 2 三个分区。
Log Size是日志文件的大小
Leader是leader副本在那个broker节点上
Replicas是它的副本在哪些broker节点上。
In sync Replicas是正在同步的副本(包括leader)
尝试关闭id为0的broker(杀掉该broker的进程),参看topic的ISR情况。
leader的选举对于消息的写入以及读取非常关键,此时有两个疑问:
使用Kafka Eagle找到某个partition的leader,再找到leader所在的broker。在Linux中强制杀掉该Kafka的进程,然后观察leader的情况。
通过观察,我们发现,leader在崩溃后,Kafka又从其他的follower中快速选举出来了leader。
Controller的选举
如果kafka是居于ZK进行选举,ZK的压力比较大,例如某个节点崩溃,这个节点上不仅仅只有一个leader,是有不少的leader需要选举,通过ISR可以快速选举。
kafka中引入Preferred Replica的概念,意思是优先的Replica。
在ISR中第一个replica就是preferred-replica.
副本存放的第一个broker,肯定就是preferred-replica
执行以下脚本可以将preferred-replica设置为leader,均匀分配每个分区的leader。
./kafka-leader-election.sh --bootstrap-server node1.itcast.cn:9092 --topic 主题 --partition=1 --election-type preferred
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。