hadoop集群启停问题_stop-mapred.sh historyserver bash: stop-mapred.sh:

作者：天景科技苑 | 2024-07-18 07:59:41

踩

stop-mapred.sh historyserver bash: stop-mapred.sh: 未找到命令

在Hadoop环境搭建时并非一次完成，其中经历一次关机，关机时Xtrem的会话窗口直接关闭，未作任何停止集群的操作。

-bash:hadoop-daemon.sh start datanode
-bash:hadoop-daemon.sh start namenode 
上述两行代码曾显示未找到命令，找不到原因所在。 
1
2
3

故选择重新格式化namenode.
先删除了以下：
在这里插入图片描述
[root@node-1 sbin]# stop-all.sh

node-1: no namenode to stop
localhost: no datanode to stop
0.0.0.0: no secondarynamenode to stop
stopping yarn daemons
no resourcemanager to stop
localhost: no nodemanager to stop
no proxyserver to stop
1
2
3
4
5
6
7

使用jsp指令可见进程仍在运行

[root@node-1 sbin]# jps
3201 Jps
1459 DataNode
1318 NodeManager
2302 ResourceManager

1
2
3
4
5
6

  今天在Cygwin上运行hadoop的时候发现一个问题，当hadoop集群运行一段时间以后，输入bin/stop-all.sh无法停止服务，在windows的任务管理器中还是能够看到那几个java进程。有时候会提示找不到进程ID，但大多时候不会提示。如下图：
1

  在网上搜索了一圈，得知了问题所在：stop-all.sh会调用stop-mapred.sh和 stop-dfs.sh去停止jobtracker, tasktrackers; namenode, datanodes。Jobtracker和namenode的停止是在本地通过调用hadoop-daemon完成的，而tasktracker,和datanode 的停止是通过调用hadoop-daemons来完成的。Hadoop-daemon实质上是ssh到每一个slave去执行一个当地的hadoop- daemon命令，比如：hadoop-daemon stop datanoade。Hadoop-daemon stop command会通过kill -0 `cat command.pid` 来测试进程是否存在，如果这个测试中有错误产生，就会报”no command to stop ”。可能原因： pid 文件丢了，导致 hadoop-daemon.sh stop XXX 时找不到进程号。 
 解决办法：默认 pid 文件放在 /tmp 目录下，不太安全。可以在 conf/hadoop-env.sh 里设置 HADOOP_PID_DIR 环境变量改变 pid 文件的存放目录。 
 所以配置的时候最好添加一个固定的目录存储hadoop的PID。
1
2
3

删除pid文件后进程依然在执行
故使用

解决方法
使用ps命令查找正在运行的namenodes、datanodes和secondary namenodes的pid，然后在/tmp目录创建对应的pid文件，重新执行stop-dfs.sh脚本，一切正常！或者可以直接运行kill -9命令把对应的pid进程杀掉。下次重新启动hdfs之前建议修改$HADOOP_PID_DIR目录，否则的话那些pid文件还是会被tmpwatch清理。

的方法

[root@node-1 hadoop-2.9.2]# jps
4433 Jps
1459 DataNode
1318 NodeManager
2302 ResourceManager
[root@node-1 hadoop-2.9.2]# kill -9 1459
[root@node-1 hadoop-2.9.2]# kill -9 1318
[root@node-1 hadoop-2.9.2]# kill -9 2302
[root@node-1 hadoop-2.9.2]# jps
1459 -- process information unavailable
1318 -- process information unavailable
4445 Jps
2302 -- process information unavailable

1
2
3
4
5
6
7
8
9
10
11
12
13
14

目前就解决到这种程度。

12/23记
为什么net+hostonly模式下
第一个网卡设置为dhcp
第二个网卡设置为静态的？

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/天景科技苑/article/detail/844413