当前位置:   article > 正文

用虚拟机Centos7搭建Hadoop集群,2024年最新面试要掌握这几个关键点

centos7搭建hadoop集群
1.4 测试JDK是否安装成功

[luoyong@hadoop102 software]$ java -version
java version “1.8.0_212”
Java™ SE Runtime Environment (build 1.8.0_212-b10)
Java HotSpot™ 64-Bit Server VM (build 25.212-b10, mixed mode)

1.5 解压安装文件到/opt/module下面

[luoyong@hadoop102 software]$ tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/
[luoyong@hadoop102 software]$ ls /opt/module/

hadoop-3.1.3  jdk1.8.0_212

1.6 将Hadoop添加到环境变量

[luoyong@hadoop102 software]$ cd /opt/module/hadoop-3.1.3/

[luoyong@hadoop102 hadoop-3.1.3]$ sudo vim /etc/profile.d/my_env.sh

#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
  • 1
  • 2
  • 3
  • 4

[luoyong@hadoop102 hadoop-3.1.3]$ source /etc/profile

1.7测试是否安装成功

[luoyong@hadoop102 hadoop-3.1.3]$ hadoop version
Hadoop 3.1.3

2.编写集群分发脚本xsync

1**)scp****(secure copy****)安全拷贝**

[luoyong@hadoop102 hadoop-3.1.3]$ cd ~
[luoyong@hadoop102 ~]$ sudo chown luoyong:luoyong -R /opt/module
[luoyong@hadoop102 ~]$ scp -r /opt/module/jdk1.8.0_212  luoyong@hadoop103:/opt/module

[luoyong@hadoop103 ~]$ scp -r luoyong@hadoop102:/opt/module/hadoop-3.1.3 /opt/module/

[luoyong@hadoop103 ~]$ cd /opt

[luoyong@hadoop103 ~]$ scp -r luoyong@hadoop102:/opt/module/* luoyong@hadoop104:/opt/module

2**)rsync****远程同步工具**

[luoyong@hadoop102 module]$  echo $PATH
/usr/local/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/home/luoyong/.local/bin:/home/luoyong/bin:/opt/module/jdk1.8.0_212/bin:/opt/module/jdk1.8.0_212/bin:/opt/module/hadoop-3.1.3/bin:/opt/module/hadoop-3.1.3/sbin

[luoyong@hadoop102 module]$ cd /home/luoyong
[luoyong@hadoop102 ~]$ mkdir bin
[luoyong@hadoop102 ~]$ cd bin
[luoyong@hadoop102 bin]$ vim xsync

#!/bin/bash

#1. 判断参数个数
if [ $# -lt 1 ]
then
    echo Not Enough Arguement!
    exit;
fi

#2. 遍历集群所有机器
for host in hadoop102 hadoop103 hadoop104
do
    echo ====================  $host  ====================
    #3. 遍历所有目录,挨个发送

    for file in $@
    do
        #4. 判断文件是否存在
        if [ -e $file ]
            then
                #5. 获取父目录
                pdir=$(cd -P $(dirname $file); pwd)

                #6. 获取当前文件的名称
                fname=$(basename $file)
                ssh $host "mkdir -p $pdir"
                rsync -av $pdir/$fname $host:$pdir
            else
                echo $file does not exists!
        fi
    done
done

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
2.1 修改脚本 xsync 具有执行权限

[luoyong@hadoop102 bin]$ chmod +x xsync
测试脚本

[luoyong@hadoop102 bin]$ xsync /home/luoyong/bin
将脚本复制到/bin中,以便全局调用

[luoyong@hadoop102 bin]$ sudo cp xsync /bin/
同步环境变量配置(root所有者)

[luoyong@hadoop102 bin]$ cd ~
[luoyong@hadoop102 bin]$ sudo /home/luoyong/bin/xsync /etc/profile.d/my_env.sh
让环境变量生效

[luoyong@hadoop103 bin]$  source /etc/profile

[luoyong@hadoop104 ~]$ cd /opt/
[luoyong@hadoop104 opt]$  source /etc/profile

2.2  SSH无密登录配置
操作三遍

[luoyong@hadoop102 bin]$ cd /home/luoyong/.ssh
[luoyong@hadoop102 .ssh]$ ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/home/luoyong/.ssh/id_rsa): 回车
Enter passphrase (empty for no passphrase): 回车
Enter same passphrase again: 回车
Your identification has been saved in /home/luoyong/.ssh/id_rsa.
Your public key has been saved in /home/luoyong/.ssh/id_rsa.pub.
The key fingerprint is:
SHA256:XSxkYP01ra6ZWEgoNRLw4r4kXT/m4/Y0qbXzF4+uNFM luoyong@hadoop102
The key’s randomart image is:
±–[RSA 2048]----+
|    …ooo    . |
|     …oo…  o .|
|    . .o o…o. o |
|   . … …o. .  |
|    . …S… .E  |
|   o . .  …o  |
|  . +   + =o++ + |
|   o . oo=o++oo .|
|    .  o+oooo+.  |
±—[SHA256]-----+

将公钥拷贝到要免密登录的目标机器上

[luoyong@hadoop102 .ssh]$ ssh-copy-id hadoop102
[luoyong@hadoop102 .ssh]$ ssh-copy-id hadoop103
[luoyong@hadoop102 .ssh]$ ssh-copy-id hadoop104

注意:

还需要在hadoop103上采用atguigu账号配置一下无密登录到hadoop102、hadoop103、hadoop104服务器上。

还需要在hadoop104上采用atguigu账号配置一下无密登录到hadoop102、hadoop103、hadoop104服务器上。

还需要在hadoop102上采用root账号,配置一下无密登录到hadoop102、hadoop103、hadoop104

2.3 配置集群(core-site.xml

[luoyong@hadoop102 .ssh]$ cd H A D O O P _ H O M E / e t c / h a d o o p [ l u o y o n g @ h a d o o p 102 h a d o o p ] HADOOP\_HOME/etc/hadoop [luoyong@hadoop102 hadoop] HADOOP_HOME/etc/hadoop[luoyong@hadoop102hadoop] vim core-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

    <!-- 指定NameNode的地址 -->

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://hadoop102:8020</value>

    </property>



    <!-- 指定hadoop数据的存储目录 -->

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/opt/module/hadoop-3.1.3/data</value>

    </property>



    <!-- 配置HDFS网页登录使用的静态用户为atguigu -->

    <property>

        <name>hadoop.http.staticuser.user</name>

        <value>luoyong</value>

    </property>

</configuration>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43

2.4 HDFS配置文件**(hdfs-site.xml)**

[luoyong@hadoop102 hadoop]$ vim hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

   <!-- nn web端访问地址-->

   <property>

        <name>dfs.namenode.http-address</name>

        <value>hadoop102:9870</value>

    </property>

   <!-- 2nn web端访问地址-->

    <property>

        <name>dfs.namenode.secondary.http-address</name>

        <value>hadoop104:9868</value>

    </property>

</configuration>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29

2.5YARN配置文件(yarn-site.xml)

[luoyong@hadoop102 hadoop]$ vim yarn-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

    <!-- 指定MR走shuffle -->
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数大数据工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)
img

一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

[外链图片转存中…(img-QUaAh7Zw-1713038891577)]

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)
[外链图片转存中…(img-GGK85Glx-1713038891577)]

一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Li_阴宅/article/detail/1002461
推荐阅读
相关标签
  

闽ICP备14008679号