当前位置:   article > 正文

进击大数据系列(二):Hadoop 安装(HDFS+YARN+MapReduce)实战操作

hadoop yarn安装

点击下方名片,设为星标

回复“1024”获取2TB学习资源!

前面介绍了 Hadoop 基本概念与生态 相关的知识点,今天我将详细的为大家介绍 大数据 Hadoop 安装(HDFS+YARN+MapReduce)实战操作 相关知识,希望大家能够从中收获多多!如有帮助,请点在看、转发支持一波!!!

安装 Hadoop(HDFS+YARN)

环境准备

这里准备三台VM虚拟机d4d8460fed1d607b77d4603fd8c1f3a2.png

下载最新的Hadoop安装包

下载地址:https://dlcdn.apache.org/hadoop/common/a891045a05b6e66f15f91d666142d77b.png2816fab0a2b016f325cf24e5191d602d.png这里下载源码包安装,默认的编译好的文件不支持snappy压缩,因此我们需要自己重新编译。

  1. $ mkdir -p /opt/bigdata/hadoop && cd /opt/bigdata/hadoop
  2. $ wget https://dlcdn.apache.org/hadoop/common/stable/hadoop-3.3.1-src.tar.gz
  3. # 解压
  4. $ tar -zvxf hadoop-3.3.1-src.tar.gz

为什么需要重新编译Hadoop源码?

匹配不同操作系统本地库环境,Hadoop某些操作比如压缩,IO需要调用系统本地库(_.so|_.dll)。更多关于大数据 Hadoop系列的学习文章,请参阅:进击大数据系列,本系列持续更新中。

重构源码

源码包目录下有个 BUILDING.txt,因为我这里的操作系统是Centos8,所以选择Centos8的操作步骤,小伙伴们找到自己对应系统的操作步骤执行即可。

$ grep -n -A40 'Building on CentOS 8' BUILDING.txt
ea0dd7c23819589b74268119748889aa.png
  1. Building on CentOS 8
  2. -----------------------------------------------------------------------
  3. * Install development tools such as GCC, autotools, OpenJDK and Maven.
  4.   $ sudo dnf group install --with-optional 'Development Tools'
  5.   $ sudo dnf install java-1.8.0-openjdk-devel maven
  6. * Install Protocol Buffers v3.7.1.
  7.   $ git clone https://github.com/protocolbuffers/protobuf
  8.   $ cd protobuf
  9.   $ git checkout v3.7.1
  10.   $ autoreconf -i
  11.   $ ./configure --prefix=/usr/local
  12.   $ make
  13.   $ sudo make install
  14.   $ cd ..
  15. * Install libraries provided by CentOS 8.
  16.   $ sudo dnf install libtirpc-devel zlib-devel lz4-devel bzip2-devel openssl-devel cyrus-sasl-devel libpmem-devel
  17. * Install optional dependencies (snappy-devel).
  18.   $ sudo dnf --enablerepo=PowerTools snappy-devel
  19. * Install optional dependencies (libzstd-devel).
  20.   $ sudo dnf install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
  21.   $ sudo dnf --enablerepo=epel install libzstd-devel
  22. * Install optional dependencies (isa-l).
  23.   $ sudo dnf --enablerepo=PowerTools install nasm
  24.   $ git clone https://github.com/intel/isa-l
  25.   $ cd isa-l/
  26.   $ ./autogen.sh
  27.   $ ./configure
  28.   $ make
  29.   $ sudo make install
  30. -----------------------------------------------------------------------

将进入Hadoop源码路径,执行maven命令进行Hadoop编译。

  1. $ cd /opt/bigdata/hadoop/hadoop-3.3.1-src
  2. # 编译
  3. $ mvn package -Pdist,native,docs -DskipTests -Dtar

【问题】Failed to execute goal org.apache.maven.plugins:maven-enforcer-plugin:3.0.0-M1:enforce

  1. [INFO] BUILD FAILURE
  2. [INFO] ------------------------------------------------------------------------
  3. [INFO] Total time: 19:49 min
  4. [INFO] Finished at: 2021-12-14T09:36:29+08:00
  5. [INFO] ------------------------------------------------------------------------
  6. [ERROR] Failed to execute goal org.apache.maven.plugins:maven-enforcer-plugin:3.0.0-M1:enforce (enforce-banned-dependencies) on project hadoop-client-check-test-invariants: Some Enforcer rules have failed. Look above for specific messages explaining why the rule failed. -> [Help 1]
  7. [ERROR]
  8. [ERROR] To see the full stack trace of the errors, re-run Maven with the -e switch.
  9. [ERROR] Re-run Maven using the -X switch to enable full debug logging.
  10. [ERROR]
  11. [ERROR] For more information about the errors and possible solutions, please read the following articles:
  12. [ERROR] [Help 1] http://cwiki.apache.org/confluence/display/MAVEN/MojoExecutionException
  13. [ERROR]
  14. [ERROR] After correcting the problems, you can resume the build with the command
  15. [ERROR] mvn -rf :hadoop-client-check-test-invariants

【解决】

  • 方案一:跳过enforcer的强制约束,在构建的命令加上跳过的指令,如:**-Denforcer.skip=true**

  • 方案二:设置规则校验失败不影响构建流程,在构建的命令上加指令,如: -Denforcer.fail=false

具体原因目前还不明确,先使用上面两个方案中的方案一跳过,有兴趣的小伙伴,可以打开DEBUG模式(-X)查看具体报错。更多关于大数据 Hadoop系列的学习文章,请参阅:进击大数据系列,本系列持续更新中。

$ mvn package -Pdist,native,docs,src -DskipTests -Dtar -Denforcer.skip=true

所以编译命令

  1. # 当然还有其它选项
  2. $ grep -n -A1 '$ mvn package' BUILDING.txt
a25c45324374c862476d1170c8518202.png
  1. $ mvn package -Pdist -DskipTests -Dtar -Dmaven.javadoc.skip=true
  2. $ mvn package -Pdist,native,docs -DskipTests -Dtar
  3. $ mvn package -Psrc -DskipTests
  4. $ mvn package -Pdist,native,docs,src -DskipTests -Dtar
  5. $ mvn package -Pdist,native -DskipTests -Dmaven.javadoc.skip \
  6.   -Dopenssl.prefix=/usr/local/opt/openssl

57d820896692a310924ad0260adf29de.png至此~Hadoop源码编译完成,

编译后的文件位于源码路径下 hadoop-dist/target/
83bc99d69caa99b584c7461e1ea862cf.png将编译好的二进制包copy出来

  1. $ cp hadoop-dist/target/hadoop-3.3.1.tar.gz /opt/bigdata/hadoop/
  2. $ cd /opt/bigdata/hadoop/
  3. $ ll
82675105ceade898b8e8fb65d28bb983.png
进行服务器及Hadoop的初始化配置
修改主机名
  1. 192.168.0.113机器上执行
  2. $ hostnamectl set-hostname hadoop-node1
  3. 192.168.0.114机器上执行
  4. $ hostnamectl set-hostname hadoop-node2
  5. 192.168.0.115机器上执行
  6. $ hostnamectl set-hostname hadoop-node3
修改主机名和IP的映射关系(所有节点都执行)
  1. $ echo "192.168.0.113 hadoop-node1" >> /etc/hosts
  2. $ echo "192.168.0.114 hadoop-node2" >> /etc/hosts
  3. $ echo "192.168.0.115 hadoop-node3" >> /etc/hosts
关闭防火墙和selinux(所有节点都执行)
  1. $ systemctl stop firewalld
  2. $ systemctl disable firewalld
  3. # 临时关闭(不用重启机器):
  4. $ setenforce 0                  ##设置SELinux 成为permissive模式
  5. # 永久关闭修改/etc/selinux/config 文件
  6. 将SELINUX=enforcing改为SELINUX=disabled
时间同步(所有节点都执行)
  1. $ dnf install chrony -y
  2. $ systemctl start chronyd
  3. $ systemctl enable chronyd

/etc/chrony.conf配置文件内容

  1. # Use public servers from the pool.ntp.org project.
  2. # Please consider joining the pool (http://www.pool.ntp.org/join.html).
  3. #pool 2.centos.pool.ntp.org iburst (这一行注释掉,增加以下两行)
  4. server ntp.aliyun.com iburst
  5. server cn.ntp.org.cn iburst

重新加载配置并测试

  1. $ systemctl restart chronyd.service
  2. $ chronyc sources -v
配置ssh免密(在hadoop-node1上执行)
  1. 1、在hadoop-node1上执行如下命令生成公私密钥:
  2. $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_dsa
  3. 2、然后将master公钥id_dsa复制到hadoop-node1|hadoop-node2|hadoop-node3进行公钥认证。
  4. $ ssh-copy-id -i /root/.ssh/id_dsa.pub hadoop-node1
  5. $ ssh-copy-id -i /root/.ssh/id_dsa.pub hadoop-node2
  6. $ ssh-copy-id -i /root/.ssh/id_dsa.pub hadoop-node3
  7. $ ssh hadoop-node1
  8. $ exit
  9. $ ssh hadoop-node2
  10. $ exit
  11. $ ssh hadoop-node3
  12. $ exit
0dbc1d6c4854a861f4642e6f3849786a.png
安装统一工作目录(所有节点都执行)
  1. # 软件安装路径
  2. $ mkdir -p /opt/bigdata/hadoop/server
  3. # 数据存储路径
  4. $ mkdir -p /opt/bigdata/hadoop/data
  5. # 安装包存放路径
  6. $ mkdir -p /opt/bigdata/hadoop/software
安装JDK(所有节点都执行)

官网下载:https://www.oracle.com/java/technologies/downloads/

  1. $ cd /opt/bigdata/hadoop/software
  2. $ tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/bigdata/hadoop/server/
  3. # 在文件加入环境变量/etc/profile
  4. export JAVA_HOME=/opt/bigdata/hadoop/server/jdk1.8.0_212
  5. export PATH=$JAVA_HOME/bin:$PATH
  6. export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
  7. # source加载
  8. $ source /etc/profile
  9. # 查看jdk版本
  10. $ java -version

21af6809c54268cb3eac2cd5ef7532e2.png更多关于大数据 Hadoop系列的学习文章,请参阅:进击大数据系列,本系列持续更新中。

开始安装 Hadoop
解压上面我编译好的安装包
  1. $ cd /opt/bigdata/hadoop/software
  2. $ tar -zxvf hadoop-3.3.1.tar.gz -C /opt/bigdata/hadoop/server/
  3. $ cd /opt/bigdata/hadoop/server/
  4. $ cd hadoop-3.3.1/
  5. $ ls -lh
99a34fcf6ac6fe926e530cc0b0407bc7.png
安装包目录说明
  1. bin #hadoop最基本的管理脚本和使用脚本的目录,这些脚本是sbin目录下管理脚本的基础实现,用户可以直接使用这些脚本管理和使用hadoop
  2. etc #hadoop配置文件所在的目录
  3. include #对外提供的编程库头文件(具体动态库和静态库在lib目录中),这些文件均是用c++定义,通常用于c++程序访问HDFS或者编写MapReduce程序。
  4. lib #该目录包含了hadoop对外提供的编程动态库和静态库,与include目录中的头文件结合使用。
  5. libexec #各个服务队用的shell配置文件所在的免疫力,可用于配置日志输出,启动参数(比如JVM参数)等基本信息。
  6. sbin #hadoop管理脚本所在的目录,主要包含HDFS和YARN中各类服务的启动、关闭脚本。
  7. share #hadoop 各个模块编译后的jar包所在的目录。官方示例也在其中
修改配置文件

配置文件目录:

/opt/bigdata/hadoop/server/hadoop-3.3.1/etc/hadoop

官方文档:https://hadoop.apache.org/docs/r3.3.1/

  • 修改hadoop-env.sh

  1. # 在hadoop-env.sh文件末尾追加
  2. export JAVA_HOME=/opt/bigdata/hadoop/server/jdk1.8.0_212
  3. export HDFS_NAMENODE_USER=root
  4. export HDFS_DATANODE_USER=root
  5. export HDFS_SECONDARYNAMENODE_USER=root
  6. export YARN_RESOURCEMANAGER_USER=root
  7. export YARN_NODEMANAGER_USER=root
  • 修改core-site.xml 核心模块配置

<configuration></configuration>中间添加如下内容

  1. <!-- 设置默认使用的文件系统 Hadoop支持file、HDFS、GFS、ali|Amazon云等文件系统 -->
  2. <property>
  3.   <name>fs.defaultFS</name>
  4.   <value>hdfs://hadoop-node1:8082</value>
  5. </property>
  6. <!-- 设置Hadoop本地保存数据路径 -->
  7. <property>
  8.   <name>hadoop.tmp.dir</name>
  9.   <value>/opt/bigdata/hadoop/data/hadoop-3.3.1</value>
  10. </property>
  11. <!-- 设置HDFS web UI用户身份 -->
  12. <property>
  13.   <name>hadoop.http.staticuser.user</name>
  14.   <value>root</value>
  15. </property>
  16. <!-- 聚合hive 用户代理设置 -->
  17. <property>
  18.   <name>hadoop.proxyuser.hosts</name>
  19.   <value>*</value>
  20. </property>
  21. <!-- 用户代理设置 -->
  22. <property>
  23.   <name>hadoop.proxyuser.root.groups</name>
  24.   <value>*</value>
  25. </property>
  26. <!-- 文件系统垃圾桶保存时间 -->
  27. <property>
  28.   <name>fs.trash.interval</name>
  29.   <value>1440</value>
  30. </property>
  • hdfs-site.xml hdfs文件系统模块配置

<configuration></configuration>中间添加如下内容

  1. <!-- 设置SNN进程运行机器位置信息 -->
  2. <property>
  3.   <name>dfs.namenode.secondary.http-address</name>
  4.   <value>hadoop-node2:9868</value>
  5. </property>
  6. <!-- 必须将dfs.webhdfs.enabled属性设置为true,否则就不能使用webhdfs的LISTSTATUS、LISTFILESTATUS等需要列出文件、文件夹状态的命令,因为这些信息都是由namenode来保存的。 -->
  7. <property>
  8.   <name>dfs.webhdfs.enabled</name>
  9.   <value>true</value>
  10. </property>

<configuration></configuration>中间添加如下内容

  1. <!-- 设置MR程序默认运行模式,yarn集群模式,local本地模式 -->
  2. <property>
  3.   <name>mapreduce.framework.name</name>
  4.   <value>yarn</value>
  5. </property>
  6. <!-- MR程序历史服务地址 -->
  7. <property>
  8.   <name>mapreduce.jobhistory.address</name>
  9.   <value>hadoop-node1:10020</value>
  10. </property>
  11. <!-- MR程序历史服务web端地址 -->
  12. <property>
  13.   <name>mapreduce.jobhistory.webapp.address</name>
  14.   <value>hadoop-node1:19888</value>
  15. </property>
  16. <!-- yarn环境变量 -->
  17. <property>
  18.   <name>yarn.app.mapreduce.am.env</name>
  19.   <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
  20. </property>
  21. <!-- map环境变量 -->
  22. <property>
  23.   <name>mapreduce.map.env</name>
  24.   <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
  25. </property>
  26. <!-- reduce环境变量 -->
  27. <property>
  28.   <name>mapreduce.reduce.env</name>
  29.   <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
  30. </property>
  • 修改yarn-site.xml yarn模块配置

<configuration></configuration>中间添加如下内容

  1. <!-- 设置YARN集群主角色运行集群位置 -->
  2. <property>
  3.   <name>yarn.resourcemanager.hostname</name>
  4.   <value>hadoop-node1</value>
  5. </property>
  6. <property>
  7.   <name>yarn.nodemanager.aux-services</name>
  8.   <value>mapreduce_shuffle</value>
  9. </property>
  10. <!-- 是否将对容器实施物理内存限制 -->
  11. <property>
  12.   <name>yarn.nodemanager.pmem-check-enabled</name>
  13.   <value>false</value>
  14. </property>
  15. <!-- 是否将对容器实施虚拟内存限制 -->
  16. <property>
  17.   <name>yarn.nodemanager.vmem-check-enabled</name>
  18.   <value>false</value>
  19. </property>
  20. <!-- 开启日志聚集 -->
  21. <property>
  22.   <name>yarn.log-aggregation-enable</name>
  23.   <value>true</value>
  24. </property>
  25. <!-- 设置yarn历史服务器地址 -->
  26. <property>
  27.   <name>yarn.log.server.url</name>
  28.   <value>http://hadoop-node1:19888/jobhistory/logs</value>
  29. </property>
  30. <!-- 设置yarn历史日志保存时间 7天 -->
  31. <property>
  32.   <name>yarn.log-aggregation.retain-seconds</name>
  33.   <value>604880</value>
  34. </property>
  • 修改workers

将下面内容覆盖文件,默认只有localhost

  1. hadoop-node1
  2. hadoop-node2
  3. hadoop-node3
d73fc8d05398bf0e89317261fabd0643.png
分发同步hadoop安装包到另外几台机器
  1. $ cd /opt/bigdata/hadoop/server/
  2. $ scp -r hadoop-3.3.1 hadoop-node2:/opt/bigdata/hadoop/server/
  3. $ scp -r hadoop-3.3.1 hadoop-node3:/opt/bigdata/hadoop/server/
将hadoop添加到环境变量(所有节点)
  1. $ vi /etc/profile
  2. export HADOOP_HOME=/opt/bigdata/hadoop/server/hadoop-3.3.1
  3. export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
  4. # 加载
  5. $ source /etc/profile

更多关于大数据 Hadoop系列的学习文章,请参阅:进击大数据系列,本系列持续更新中。

Hadoop集群启动(hadoop-node1上执行)
(首次启动)格式化namenode(只能执行一次)
  • 首次启动HDFS时,必须对其进行格式化操作

  • format本质上初始化工作,进行HDFS清理和准备工作

$ hdfs namenode -format
378153254850ed507130bbd384bb21e4.png
手动逐个进程启停

每台机器每次手动启动关闭一个角色进程,可以精确控制每个进程启停,避免群起群停

HDFS集群启动

$ hdfs --daemon start|stop namenode|datanode|secondarynamenode

YARN集群启动

$ yarn --daemon start|stop resourcemanager|nodemanager
通过shell脚本一键启动

在hadoop-node1上,使用软件自带的shell脚本一键启动。前提:配置好机器之间的SSH免密登录和works文件

  • HDFS集群启停

  1. $ start-dfs.sh
  2. $ stop-dfs.sh #这里不执行

f7b767c184906b838a2132528e417411.png检查java进程

$ jps
208d2d59bd9ebe11c76f26a8c2103230.png
  • YARN集群启停

  1. $ start-yarn.sh
  2. $ stop-yarn.sh # 这里不执行
  3. # 查看java进程
  4. $ jps

3285815a0f61e7674fcd8f9dd426aa42.png通过日志检查,日志路径:/opt/bigdata/hadoop/server/hadoop-3.3.1/logs

  1. $ cd /opt/bigdata/hadoop/server/hadoop-3.3.1/logs
  2. $ ll
c3279e8ca885bc56e8a70fa871640eb8.png
  • Hadoop集群启停(HDFS+YARN)

  1. $ start-all.sh
  2. $ stop-all.sh
通过web页面访问

【注意】在window C:\Windows\System32\drivers\etc\hosts文件配置域名映射,hosts文件中增加如下内容:

  1. 192.168.0.113 hadoop-node1
  2. 192.168.0.114 hadoop-node2
  3. 192.168.0.115 hadoop-node3

HDFS集群

地址:http://namenode_host:9870

这里地址为:http://192.168.0.113:9870586c629a19214d426d815db790cfd1e8.png

YARN集群

地址:http://resourcemanager_host:8088

这里地址为:http://192.168.0.113:8088a766aec8cb65a7bf3846c88cfc1c14c8.png到此为止,hadoop和yarn集群就已经部署完了~

Hadoop 实战操作

HDFS 实战操作
命令介绍
  1. # 访问本地文件系统
  2. $ hadoop fs -ls file:///
  3. # 默认不带协议就是访问hdfs文件系统
  4. $ hadoop fs -ls /
查看配置
  1. $ cd /opt/bigdata/hadoop/server/hadoop-3.3.1/etc/hadoop
  2. $ grep -C5 'fs.defaultFS' core-site.xml
42cdfcb969dc0b28766dd1a68ab9b32c.png
  1. # 这里加上hdfs协议与不带协议等价
  2. $ hadoop fs -ls hdfs://hadoop-node1:8082/

51fee0b273a67c9b4a3b810e8af51526.png【温馨提示】所以默认不带协议就是访问HDFS文件系统。更多关于大数据 Hadoop系列的学习文章,请参阅:进击大数据系列,本系列持续更新中。

老版本的使用方式
  1. $ hdfs dfs -ls /
  2. $ hdfs dfs -ls hdfs://hadoop-node1:8082/
3c5a3130f89c276df7ef2b8bb925b281.png

1、创建和删除文件

  1. # 查看
  2. $ hadoop fs -ls /
  3. # 创建目录
  4. $ hadoop fs -mkdir /test20211214
  5. $ hadoop fs -ls /
  6. # 创建文件
  7. $ hadoop fs -touchz /test20211214/001.txt
  8. $ hadoop fs -ls /test20211214
0833247c224c8e2cdb0bd6efc07b2a17.png

2、web端查看
e239d832a17aaeacd47de6a71c43f5b6.pngb827ca12916059d48413905b9fca64e9.png

  1. # 删除文件
  2. $ hadoop fs -rm /test20211214/001.txt
  3. # 删除目录
  4. $ hadoop fs -rm -r /test20211214

3、推送文件到hdfs

  1. $ touch test001.txt
  2. $ hadoop fs -put test001.txt /
  3. $ hadoop fs -ls /
ad592c71e881401e2458d05fc80d56dc.png

4、从hdfs上拉取文件

  1. # 把test001.txt拉取下来,并改名为a.txt
  2. $ hadoop fs -get /test001.txt a.txt
63fa7fba5fed8d74be70db4ef4e3e903.png
MapReduce+YARN 实战操作
执行Hadoop官方自带的MapReduce案例,评估圆周率Π的值
  1. $ cd /opt/bigdata/hadoop/server/hadoop-3.3.1/share/hadoop/mapreduce
  2. $ hadoop jar hadoop-mapreduce-examples-3.3.1.jar pi 2 4
5200f138a2e23369c98b25041da42342.png
统计单词

创建hello.txt,文件内容如下:

  1. hello hadoop yarn world  
  2. hello yarn hadoop  
  3. hello world

在hdfs创建存放文件目录

  1. $ hadoop fs -mkdir -p /wordcount/input
  2. # 把文件上传到hdfs
  3. $ hadoop fs -put hello.txt /wordcount/input/

e5fe01721b03f7d380f0e73c2ed78bc0.png执行

  1. $ cd /opt/bigdata/hadoop/server/hadoop-3.3.1/share/hadoop/mapreduce
  2. $ hadoop jar hadoop-mapreduce-examples-3.3.1.jar wordcount /wordcount/input /wordcount/output

2a8006d3f9763ab552f11368e7852974.png812d3e8a58aff5179ad59d3934c711a4.png

Yarn的常用命令

使用语法:yarn application [options] #打印报告,申请和杀死任务

  1. -appStates <States>         #与-list一起使用,可根据输入的逗号分隔的应用程序状态列表来过滤应用程序。有效的应用程序状态可以是以下之一:ALL,NEW,NEW_SAVING,SUBMITTED,ACCEPTED,RUNNING,FINISHED,FAILED,KILLED
  2. -appTypes <Types>           #与-list一起使用,可以根据输入的逗号分隔的应用程序类型列表来过滤应用程序。
  3. -list                       #列出RM中的应用程序。支持使用-appTypes来根据应用程序类型过滤应用程序,并支持使用-appStates来根据应用程序状态过滤应用程序。
  4. -kill <ApplicationId>       #终止应用程序。
  5. -status <ApplicationId>     #打印应用程序的状态。
简单示例
  1. # 列出在运行的应用程序
  2. $ yarn application --list
  3. # 列出FINISHED的应用程序
  4. $ yarn application -appStates FINISHED --list

94759cb15d45498316c708bc4a95e354.png更多操作命令,可以自行查看帮助。

  1. $ yarn -help
  2. [root@hadoop-node1 hadoop]# yarn -help
  3. Usage: yarn [OPTIONS] SUBCOMMAND [SUBCOMMAND OPTIONS]
  4.  or    yarn [OPTIONS] CLASSNAME [CLASSNAME OPTIONS]
  5.   where CLASSNAME is a user-provided Java class
  6.   OPTIONS is none or any of:
  7. --buildpaths                       attempt to add class files from build tree
  8. --config dir                       Hadoop config directory
  9. --daemon (start|status|stop)       operate on a daemon
  10. --debug                            turn on shell script debug mode
  11. --help                             usage information
  12. --hostnames list[,of,host,names]   hosts to use in worker mode
  13. --hosts filename                   list of hosts to use in worker mode
  14. --loglevel level                   set the log4j level for this command
  15. --workers                          turn on worker mode
  16.   SUBCOMMAND is one of:
  17.     Admin Commands:
  18. daemonlog            get/set the log level for each daemon
  19. node                 prints node report(s)
  20. rmadmin              admin tools
  21. scmadmin             SharedCacheManager admin tools
  22.     Client Commands:
  23. app|application      prints application(s) report/kill application/manage long running application
  24. applicationattempt   prints applicationattempt(s) report
  25. classpath            prints the class path needed to get the hadoop jar and the required libraries
  26. cluster              prints cluster information
  27. container            prints container(s) report
  28. envvars              display computed Hadoop environment variables
  29. fs2cs                converts Fair Scheduler configuration to Capacity Scheduler (EXPERIMENTAL)
  30. jar <jar>            run a jar file
  31. logs                 dump container logs
  32. nodeattributes       node attributes cli client
  33. queue                prints queue information
  34. schedulerconf        Updates scheduler configuration
  35. timelinereader       run the timeline reader server
  36. top                  view cluster information
  37. version              print the version
  38.     Daemon Commands:
  39. nodemanager          run a nodemanager on each worker
  40. proxyserver          run the web app proxy server
  41. registrydns          run the registry DNS server
  42. resourcemanager      run the ResourceManager
  43. router               run the Router daemon
  44. sharedcachemanager   run the SharedCacheManager daemon
  45. timelineserver       run the timeline server
  46. SUBCOMMAND may print help when invoked w/o parameters or with -h.

这里只是简单的dmeo案例演示操作……

来源:https://www.cnblogs.com/liugp/p/16101242.html

读者专属技术群

构建高质量的技术交流社群,欢迎从事后端开发、运维技术进群(备注岗位),相互帮助,一起进步!请文明发言,主要以技术交流、内推、行业探讨为主

广告人士勿入,切勿轻信私聊,防止被骗

ebc27e4b9db5942649fb75b9bbffbe01.jpeg

推荐阅读 点击标题可跳转

我司使用7年多的容器化部署方案!有点牛 X

卧槽!Win10 开始耍流氓了。。。

一款可以通过Web访问的Linux终端神器(已开源)

这 Nginx 日志分割方案太及时了!太全面了

浏览不良网站一定会有记录吗?小心被叫去喝茶

百度,这下要歇菜了?网友们都在声讨它...

弃用 Docker kill,事实证明,它更牛逼!

062a357f030ab87ee0bbde1f6c37bae9.png

PS:因为公众号平台更改了推送规则,如果不想错过内容,记得读完点一下在看,加个星标,这样每次新文章推送才会第一时间出现在你的订阅列表里。点在看支持我们吧!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/852282
推荐阅读
相关标签
  

闽ICP备14008679号