赞
踩
配置Hadoop的主要5个文件
序号 | 配置文件名 | 配置对象 | 主要内容 |
---|---|---|---|
1 | hadoop-env.sh | hadoop运行环境 | 用来定义hadoop运行环境相关的配置信息 |
2 | core-site.xml | 集群全局参数 | 用于定义系统级别的参数,如HDFS URI 、Hadoop的临时目录等 |
3 | hdfs-site.xml | HDFS | 如名称节点和数据节点的存放位置、文件副本的个数、文件的读取权限等 |
4 | mapred-site.xml | Mapreduce参数 | 包括JobHistory Server 和应用程序参数两部分,如reduce任务的默认个数、任务所能够使用内存的默认上下限等 |
5 | yarn-site.xml | 集群资源管理系统参数 | 配置ResourceManager ,nodeManager的通信端口,web监控端口等 |
core-site.xml最重要的参数及其解释如下:
No. | 参数名 | 默认值 | 参数解释 |
---|---|---|---|
1 | fs.defaultFS | file:/// | 文件系统主机和端口 |
2 | io.file.buffer.size | 4096 | 流文件的缓冲区大小 |
3 | hadoop.tmp.dir | /tmp/hadoop-${user.name } | 临时文件夹 |
本小节修改fs.defaultFS和hadoop.tmp.dir参数为例
修改前:
修改后
解析:配置HDFS的namenode的地址;配置hadoop运行时产生的文件的目录
1)fs.default.name是NameNode的URI。hdfs://主机名:端口/
2)hadoop.tmp.dir :Hadoop的默认临时路径,这个最好配置,如果在新增节点或者其他情况下莫名其妙的DataNode启动不了,就删除此文件中的tmp目录即可。不过如果删除了NameNode机器的此目录,那么就需要重新执行NameNode格式化的命令。
保存退出
通过hadoop官方网址查询core-site.xml 配置信息
可以了解最新的全部的core-site.xml 配置信息,而且包括一些过时的定义标识,从而更好地维护您的集群。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。