当前位置:   article > 正文

yarn日常维护之nm健康状态为false的原因查找_nodemanager 8042端口未生效

nodemanager 8042端口未生效

最近几天使用yarn集群来布flink,结果发现每次nodemanager只能启动一个,而另一个无法启动,然后取8042端口查看情况,发现NodeHealthyStatus的状态变成了False,

正常情况下应该是true,然后查看日志发现,

  1. 2019-07-18 21:45:50,504 WARN org.apache.hadoop.yarn.server.nodemanager.DirectoryCollection: Directory /opt/hadoop-2.7.3/tmp/nm-local-dir error, used space above threshold of 90.0%, removing from list of valid directories
  2. 2019-07-18 21:45:50,504 WARN org.apache.hadoop.yarn.server.nodemanager.DirectoryCollection: Directory /opt/hadoop-2.7.3/logs/userlogs error, used space above threshold of 90.0%, removing from list of valid directories

所以初步断定是因为disk使用量太大, hdfs的数据目录使用率达到了90%,然后yarn就修改nm的状态为不健康,所以我们只需要进行修改阀值就ok,或者动手删除数据扩大容量

我的选择是先修改阀值

  1. <property>
  2. <name>yarn.nodemanager.disk-health-checker.max-disk-utilization-per-disk-percentage</name>
  3. <value>98.5</value>
  4. </property>

接下来再启动看看,发现还是为false

所以,只能删除一些文件,让容量下降下来,这个方法最后发现是最直接和最有效的方法了,效果图:

终于可以进行下一步flink的yarn部署了

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/865845
推荐阅读
相关标签
  

闽ICP备14008679号