赞
踩
hadoop集群由于主节点的磁盘空间满了,没有及时发现,导致主节点挂掉,过了好久才发现集群访问不了,排查,配置了ha但是灭有自动切换
排查原因:
先清理满了的磁盘
2,查看配置,hdfs-site.xml中dfs.ha.fencing.methods 设置为>sshfence(hdfs :22)< ,
3,查看zkfc日志,发现日志中显示没有/home/hdfs /.ssh/id rsa文件
4,查看 hdfs-site.xml
dfs.ha.fencing. ssh.private-key-files
/home/hdfs /.ssh/id rsa
5,创建秘钥文件 ,两个主节点执行
ssh-keygen -t rsa
注意用户
6,更改dfs.ha.fencing.methods设置为shell(true)
7重启,zkfc,重启standby节点
8,在之前挂掉的主节点执行同步操作hdfs namenode -bootstrapStandby
9集群状态自动切换了
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。