当前位置:   article > 正文

最新hadoop平台完全分布式搭建,大数据开发详解

最新hadoop平台完全分布式搭建,大数据开发详解

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

1.进入到/opt/module/hadoop3/etc/hadoop目录下

cd /opt/module/hadoop3/etc/hadoop

2.修改core-site.xml,hdfs-site.xml,yarn-site.xml,mapred-site.xml四个配置文件

(hadoop默认配置文件在/opt/module/hadoop3/share/hadoop中)

核心配置文件core-site.xml

fs.defaultFS

hdfs://master:9820

(hadoop.tmp.dir是Hadoop文件系统依赖的基础配置,默认存放在/tmp/{$user}下。但是存放在/tmp下是不安全的,因为系统重启后文件有可能被删除,所以会指向另外的路径)

hadoop.tmp.dir

/opt/module/hadoop3/data

hadoop.http.staticuser.user

root

HDFS配置文件hdfs-site.xml

dfs.namenode.http-address

master:9870

(该部分可能不需要)

dfs.namenode.secondary.http-address

slave2:9868

dfs.replication

3

YARN配置文件yarn-site.xml

yarn.resourcemanager.hostname

slave1

yarn.nodemanager.aux-services

mapreduce_shuffle

MapReduce配置文件mapred-site.xml

mapreduce.framework.name

yarn

3.修改hadoop-env.sh文件

vim hadoop-env.sh

添加内容

export JAVA_HOME=/opt/module/jdk1.8

export HDFS_NAMENODE_USER=root

export HDFS_DATANODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

4.修改workers文件

vim workers

删除原来的localhost修改为

master

slave1

slave2

5.用scp分发第一、二步的文件到所以节点

cd /opt/module

scp –r hadoop3 slave1:/opt/module

scp –r hadoop3 slave2:/opt/module

6.在master节点初始化namenode

hdfs namenode -format

7.启动hadoop集群

start-dfs.sh

start-yarn.sh(yarn在哪个节点,就在哪个节点启动)

start-all.sh(在yarn那个节点使用,可以把hdfs,yarn都启动)

8.查看java进程

jps

9.检查是否成功启动hadoop集群

打开网址http://master:9870(成功打开则说明启动成功)

扩展一****、历史服务器配置****

1.配置mapred-site.xml

添加内容:

mapreduce.jobhistory.address

master:10020

<!—历史服务器web端地址 -->

mapreduce.jobhistory.webapp.address

master:19888

2.分发配置到其他节点

3.启动历史服务器

mapred --daemon start historyserver

扩展二、日志聚集功能配置

1.配置yarn-site.xml

添加内容:

<!—开启日志聚集功能–>

yarn.log-aggregation-enable

true

<!—设置日志聚集服务器地址–>

yarn.log.server.url

http://master:19888/jobhistory/logs

<!—设置日志保留时间为7天–>

yarn.log-aggregation.retain

604800

2.分发配置到其他节点

3.重启yarn、historyserser

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

value>604800

2.分发配置到其他节点

3.重启yarn、historyserser

[外链图片转存中…(img-n4boWZPZ-1715811004910)]
[外链图片转存中…(img-YBcjN3Wq-1715811004910)]
[外链图片转存中…(img-ONKIqTcK-1715811004910)]

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/633784
推荐阅读
相关标签
  

闽ICP备14008679号