【运维】Hadoop集群异常：两个NameNode全部为StandBy状态_高可用两台都是standby

作者：凡人多烦事01 | 2024-04-17 04:24:47

踩

高可用两台都是standby

查看之前的文章：记一次flink on hadoop with per-job 报错排查，重新回顾一下HDFS的高可用：

主备切换的逻辑：
active节点通过zkfc将状态写到zk中，standBy对此状态感兴趣添加监听，当active宕机，zkfc立即通知standy转换为active。

当zkfc挂掉之后，这些namenode节点状态则不能维护和相互同步，就有可能都为standy。

重启zkfc之后namenode正常

namenode的高可用是zk维护实现的，可以尝试初始化namenode在zookeeper的元数据。

//任选一台StandBy状态的节点做zk的初始化。
hdfs zkfc -formatZK

//sbin目录下重启集群
start-dfs.sh
1
2
3
4
5

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/凡人多烦事01/article/detail/438194