当前位置:   article > 正文

(八)大数据实战——hadoop集群组件启动及服务组件配置修改

(八)大数据实战——hadoop集群组件启动及服务组件配置修改

前言

本节内容我们主要介绍,如何启动hadoop的组件服务,例如hdfs、yarn等,并通过修改自定义配置文件,修改我们组件的配置。关于hadoop组件的部署同上一节内容,如下:

hadoop集群组件分布
hadoop101hadoop102hadoop103
HDFS

NameNode

DataNode

DataNode

SecondaryNameNode

DataNode

YARNNodeManagerResourceManager NodeManagerNodeManager

正文

  • hadoop服务组件的配置文件

①hadoop服务默认配置文件说明

文件名称默认存放位置说明
core-default.xmlhadoop-common-3.1.3.jar/core-default.xml核心配置文件
hdfs-default.xmlhadoop-hdfs-3.1.3.jar/hdfs-default.xmlhdfs组件配置文件
yarn-default.xmlhadoop-yarn-common-3.1.3.jar/yarn-default.xmlyarn组件配置文件
mapred-default.xmlhadoop-mapreduce-client-core-3.1.3.jar/mapred-default.xmlMapReduce组件配置文件

②在/opt/module/hadoop-3.1.3/etc/hadoop目录下修改hadoop自定义配置文件

a.使用vi编辑器修改core-site.xml核心配置文件

  1. <!-- core-site.xml配置 -->
  2. <configuration>
  3. <!-- 指定NameNode的地址 -->
  4. <property>
  5. <name>fs.defaultFS</name>
  6. <value>hdfs://hadoop101:8020</value>
  7. </property>
  8. <!-- 指定hadoop数据的存储目录 -->
  9. <property>
  10. <name>hadoop.tmp.dir</name>
  11. <value>/opt/module/hadoop-3.1.3/data</value>
  12. </property>
  13. <!-- 配置HDFS网页登录使用的静态用户为hadoop -->
  14. <property>
  15. <name>hadoop.http.staticuser.user</name>
  16. <value>hadoop</value>
  17. </property>
  18. </configuration>

b.使用vi编辑器修改hdfs-site.xml配置文件

  1. <!-- nn web 端访问地址-->
  2. <property>
  3. <name>dfs.namenode.http-address</name>
  4. <value>hadoop101:9870</value>
  5. </property>
  6. <!-- 2nn web 端访问地址-->
  7. <property>
  8. <name>dfs.namenode.secondary.http-address</name>
  9. <value>hadoop103:9868</value>
  10. </property>

c.使用vi编辑器修改yarn-site.xml配置文件

  1. <!-- 指定 MR 走 shuffle -->
  2. <property>
  3. <name>yarn.nodemanager.aux-services</name>
  4. <value>mapreduce_shuffle</value>
  5. </property>
  6. <!-- 指定 ResourceManager 的地址-->
  7. <property>
  8. <name>yarn.resourcemanager.hostname</name>
  9. <value>hadoop102</value>
  10. </property>
  11. <!-- 环境变量的继承 -->
  12. <property>
  13. <name>yarn.nodemanager.env-whitelist</name>
  14. <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
  15. </property>

d.使用vi编辑器修改mapred-site.xml 配置文件

  1. <!-- 指定 MapReduce 程序运行在 Yarn 上 -->
  2. <property>
  3. <name>mapreduce.framework.name</name>
  4. <value>yarn</value>
  5. </property>

e.配置workers

③分发修改的配置文件到hadoop102与hadoop103服务器

命令:hsync /opt/module/hadoop-3.1.3/etc/hadoop

  • 将hadoop集群的root账号切换到hadoop账号,实现hadoop账户之间的免密登录和文件共享

①hadoop集群服务器全部切换到hadoop账户下,实现hadoop账户下的免密登录 ,所有hadoop服务器都执行此项操作

②在hadoop101服务器上的hadoop账户下创建共享文件脚本

  1. #!/bin/bash
  2. #1. 判断参数个数,此处的传参为文件名称或者目录名称
  3. if [ $# -lt 1 ]
  4. then
  5. echo Not Enough Arguement!
  6. exit;
  7. fi
  8. #2. 遍历集群所有机器
  9. for host in hadoop101 hadoop102 hadoop103
  10. do
  11. echo ==================== $host ====================
  12. #3. 遍历所有目录,挨个发送
  13. for file in $@
  14. do
  15. #4. 判断文件是否存在
  16. if [ -e $file ]
  17. then
  18. #5. 获取父目录
  19. pdir=$(cd -P $(dirname $file); pwd)
  20. #6. 获取当前文件的名称
  21. fname=$(basename $file)
  22. ssh $host "mkdir -p $pdir"
  23. rsync -av $pdir/$fname $host:$pdir
  24. else
  25. echo $file does not exists!
  26. fi
  27. done
  28. done

③在可执行脚本hsync目录/home/hadoop/bin下的hadoop101、hadoop02、hadoop103服务器上分别执行以下命令

  • hadoop服务组件启动

①如果集群是第一次启动,需要在 hadoop101节点格式化NameNode

命令:hdfs namenode -format

②在hadoop101服务器上启动hdfs

命令:sbin/start-dfs.sh

③在hadoop102服务器上启动yarn

命令:sbin/start-yarn.sh

  • 验证hadoop集群 

①访问hdfs地址:http://hadoop101:9870/

② 访问2nn的web地址

③访问yarn的web地址:http://hadoop102:8088/

结语

至此,关于hadoop组件启动及自定义配置文件的内容到这里就结束了,我们下期见。。。。。。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/633923
推荐阅读
相关标签
  

闽ICP备14008679号