当前位置:   article > 正文

【运维】Hadoop集群异常:两个NameNode全部为StandBy状态_高可用两台都是standby

高可用两台都是standby

1. 查看zkfc进程是否挂掉

查看之前的文章:记一次flink on hadoop with per-job 报错排查 ,重新回顾一下HDFS的高可用:

主备切换的逻辑:
active节点通过zkfc将状态写到zk中,standBy对此状态感兴趣添加监听,当active宕机,zkfc立即通知standy转换为active。

当zkfc挂掉之后,这些namenode节点状态则不能维护和相互同步,就有可能都为standy。

重启zkfc之后namenode正常

 
 

2. 初始化zookeeper来重新竞选

namenode的高可用是zk维护实现的,可以尝试初始化namenode在zookeeper的元数据。

//任选一台StandBy状态的节点做zk的初始化。
hdfs zkfc -formatZK

//sbin目录下重启集群
start-dfs.sh
  • 1
  • 2
  • 3
  • 4
  • 5
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/438194
推荐阅读
相关标签
  

闽ICP备14008679号