我家小花儿

这个屌丝很懒，什么也没留下！

热门标签

Hadoop 集群安装

作者：我家小花儿 | 2024-07-15 06:24:19

踩

hadoop 集群安装

文章目录

1. master 中安装 Hadoop
2. master 中配置 Hadoop
3. slave 中配置 Hadoop
- (1) 关闭防火墙
- (2) 生效配置
4. 启动及验证
4. 网页查看集群

1. master 中安装 Hadoop

将Hadoop安装包解压，并复制到指定文件夹/usr/local/src/ 下

tar -zxvf hadoop-2.7.7.tar.gz
mv ./hadoop-2.7.7/ /usr/local/src/
1
2

和配置Java环境变量一样地，配置Hadoop环境变量

vi /root/.bash_profile  # 根据要求修改这个文件，也可以修改/etc/profile
1

然后在末尾写上

export HADOOP_HOME=/usr/local/src/hadoop-2.7.7
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

让配置生效

source /root/.bash_profile
1

然后终端输入 hadoop 看看是不是安装成功了
在这里插入图片描述

2. master 中配置 Hadoop

Hadoop配置文件在 /hadoop-2.7.7/etc/hadoop 目录下，ls -l可以看到有很多配置文件
在这里插入图片描述

(0) 配置 hadoop-env.sh 文件

cd /usr/local/src/hadoop-2.7.7/etc/hadoop
vi hadoop-env.sh
1
2

在文末添加以下文字：

export JAVA_HOME=/usr/local/src/jdk1.8.0_162
1

(1) 配置 core-site.xml 文件

现在 Hadoop 安装路径新建 tmp文件夹。

cd /usr/local/src/hadoop-2.7.7
mkdir tmp
1
2

修改Hadoop核心配置文件core-site.xml，这里配置的是HDFS的地址和端口号。

cd /usr/local/src/hadoop-2.7.7/etc/hadoop
vi core-site.xml
1
2

<configuration>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/usr/local/src/hadoop-2.7.7/tmp</value>
                <description>A base for other temporary directories.</description>
        </property>
        <!--file system properties-->
        <property>
                <name>fs.default.name</name>
                <!--这是 master 的 ip-->
                <value>hdfs://192.168.1.101:9000</value>   
        </property>
</configuration>
1
2
3
4
5
6
7
8
9
10
11
12
13

在这里插入图片描述
备注： 如没有配置hadoop.tmp.dir参数，此时系统默认的临时目录为：/tmp/hadoo-hadoop。而这个目录在每次重启后都会被干掉，必须重新执行format才行，否则会出错。

(2) 配置 hdfs-site.xml文件

vi hdfs-site.xml
1

修改Hadoop中HDFS的配置，配置的备份方式默认为3。
replication 是数据副本数量，默认为3，slave少于3台就会报错。

<configuration>
        <property>
                <name>dfs.replication</name>
                <value>2</value>
        </property>
</configuration>
1
2
3
4
5
6

在这里插入图片描述

(3) 配置 mapred-site.xml 文件

只有 mapred-site.xml.template 文件，则先在 mapred-site.xml.template 中写配置，然后再复制一份，并命名为mapred.xml，该文件是MapReduce的配置文件，用于指定MapReduce使用的框架，配置的是JobTracker的地址和端口。

vi mapred-site.xml.template
1

<configuration>
        <property>
                <name>mapred.job.tracker</name>
                <!--这里是 master 的 ip-->
                <value>http://192.168.1.101:9001</value>
        </property>
</configuration>
1
2
3
4
5
6
7

在这里插入图片描述

(4) 配置 slaves文件（Master主机特有）

vi slaves
1

在里面删掉"localhost"，加入集群中所有Slave机器的IP，也是每行一个。

192.168.1.102
192.168.1.103

在这里插入图片描述

(5) 关闭防火墙

systemctl stop firewalld
1

(6) 把 Hadoop 安装包传到 slave

把安装包和环境变量文件传到 slave

scp -r /usr/local/src/hadoop-2.7.7/ root@192.168.1.102:/usr/local/src/
scp -r /usr/local/src/hadoop-2.7.7/ root@192.168.1.103:/usr/local/src/
scp /root/.bash_profile root@192.168.1.102:/root
scp /root/.bash_profile root@192.168.1.103:/root
1
2
3
4

现在在Master机器上的Hadoop配置就结束了，剩下的就是配置Slave机器上的Hadoop。