当前位置:   article > 正文

Hadoop学习-集群配置文件core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml_将目录内的core-site.xml、hdfs-site.xml、mapred-site.xml与y

将目录内的core-site.xml、hdfs-site.xml、mapred-site.xml与yarn-site.xml复制到

配置核心文件

core-site.xml

编辑core-site.xml(进入hadoop文件夹内)

  1. vim etc/hadoop/core-site.xml
  2. --------------------------------------------------------
  3. <configuration>
  4.     <!-- 指定NameNode的地址 -->
  5.     <property>
  6.         <name>fs.deaultFS</name>
  7.         <value>hdfs://hadoop100:8020</value>
  8.     </property>
  9.     <!-- 指定hadoop数据的存储目录 -->
  10.     <property>
  11.         <name>hadoop.tmp.dir</name>
  12.         <value>/opt/module/hadoop-3.1.3/data</value>
  13.     </property>
  14.     <!-- 指定hadoop数据的存储目录 -->
  15. <property>
  16. <name>hadoop.http.staticuser.user</name>
  17. <value>root</value>
  18. </property>
  19. </configuration>
  20. ----------------------------------------------------------
hdfs-site.xml
  1. vim etc/hadoop/hdfs-site.xml
  2. ---------------------------------------------------------
  3. <configuration>
  4. <!-- nn web端访问地址 -->
  5. <property>
  6. <name>dfs.namenode.http-address</name>
  7. <value>hadoop100:9870</value>
  8. </property>
  9. <!-- 2nn web端访问地址 -->
  10. <property>
  11. <name>dfs.namenode.secondary.http-address</name>
  12. <value>hadoop102</value>
  13. </property>
  14. </configuration>
  15. ----------------------------------------------------------
yarn-site.xml
  1. vim etc/hadoop/hdfs-site.xml
  2. ----------------------------------------------------------
  3. <configuration>
  4.     <!-- 指定MR走shuffle -->
  5.         <property>
  6.             <name>yarn.nodemanager.aux-services</name>
  7.             <value>mapreduce_shuffle</value>
  8.         </property>
  9.     <!-- 指定ResourceManager的地址-->
  10.         <property>
  11.             <name>varn.resourcemanager.hostname</name>
  12.             <value>hadoop101</value>
  13.         </property>
  14.     <!-- 环境变量的继承 -->
  15.         <property>
  16.             <name>varn.nodemanager.eny-whitelist</name>
  17.             <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOPYARN_HOME.HADOOP_MAPRED_HOME</value>
  18.         </property>
  19. </configuration>
  20. -----------------------------------------------------------
mapred-site.xml
  1. vim etc/hadoop/mapred-site.xml
  2. -----------------------------------------------------------
  3. <confiquration>
  4.     <!-- 指定 MapReduce 程序运行在 Yarn 上 -->
  5.         <property>
  6.             <name>mapreduce.framework.name</name>
  7.             <value>yarn</value>
  8.         </property>
  9. </confiquration>
  10. -----------------------------------------------------------
配置完后要分发给其他服务器,可以使用之前写的分发脚本xsync进行快速分发
配置workers(各集群节点)
  1. vim etc/hadoop/workers
  2. -----------------------------------------------------------
  3. hadoop102
  4. hadoop103
  5. hadoop104
  6. -----------------------------------------------------------

启动集群

如果集群是第一次启动,需要在 hadoop102 节点格式化 NameNode(注意:格式化NameNode,会产生新的集群 id,导致 NameNode 和 DataNode 的集群 id 不一致,集群找不到已往数据。如果集群在运行过程中报错,需要重新格式化 NameNode 的话,一定要先停上 namenode 和 datanode 进程,并且要删除所有机器的 data 和 logs 目录,然后再进行格式化)

hdfs namenode -format
启动hdfs
sbin/start-dfs.sh
在配置了ResourceManager(hadoop103)的节点启动YARN
sbin/start-yarn.sh
web查看HDFS的NameNode:

浏览器输入:http://hadoop102:9870

web查看YARN的ResourceManager

浏览器输入: http://hadoop103:8088

集群基本测试

上传文件到集群
  1. hadoop fs -mkdir /xxx
  2. hadoop fs -put /xxx
查看HDFS在磁盘存储文件内容
  1. cd /hadoop-3.1.3/data/dfs/data/current/BP-349999175-192.168.10/current/finalized/subdiro/subdir0
  2. cat blk_1073741825

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/633912
推荐阅读
相关标签
  

闽ICP备14008679号