当前位置:   article > 正文

解决 RMContainerAllocator: Exception while unregistering java.lang.NullPointerException问题_error [rmcommunicator allocator] org.apache.hadoop

error [rmcommunicator allocator] org.apache.hadoop.mapreduce.v2.app.rm.rmcom

在hadoop2.5.2环境中,执行一个mr任务,计算结果正确输出到hdfs里面了,但是job异常退出了,

报错信息如下:


大概意思就是有任务失败了吧。

然后查看各节点日志,发现有一个节点报错了,报错信息如下:

 
ERROR [Thread-856] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Exception while unregistering 
java.lang.NullPointerException
    at org.apache.hadoop.mapreduce.v2.util.MRWebAppUtil.getApplicationWebURLOnJHSWithoutScheme(MRWebAppUtil.java:135)
    at org.apache.hadoop.mapreduce.v2.util.MRWebAppUtil.getApplicationWebURLOnJHSWithScheme(MRWebAppUtil.java:150)
    at org.apache.hadoop.mapreduce.v2.app.rm.RMCommunicator.doUnregistration(RMCommunicator.java:212)
    at org.apache.hadoop.mapreduce.v2.app.rm.RMCommunicator.unregister(RMCommunicator.java:182)
    at org.apache.hadoop.mapreduce.v2.app.rm.RMCommunicator.serviceStop(RMCommunicator.java:255)

于是开始gg,发现hadoop官网上有相关报错issue:

https://issues.apache.org/jira/browse/MAPREDUCE-6213

这个bug的原因是这样描述的:

When DNS failed for a time, all MapReduce jobs which completed during that time got failed.

没理解,DNS不通导致的吗?为什么我3个节点就其中一个必然失败,其他的两个节点不会失败?

暂时不管了,下面有解决方案:


需要改代码,org.apache.hadoop.mapreduce.v2.util.MRWebAppUtil 

这个类在hadoop-mapreduce-client-common-2.5.2.jar包中,直接解压这个jar包,获得MRWebAppUtil.class文件,

反编译后修改相j关代码重新生成新的MRWebAppUtil.class文件,覆盖原文件。

执行jar cvf hadoop-mapreduce-client-common-2.5.2.jar * 生成新的jar包。

替换到hadoop中/share/hadoop/mapreduce目录。

重启mapreduce,问题解决了。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/394497
推荐阅读
相关标签
  

闽ICP备14008679号