当前位置:   article > 正文

hadoop伪分布式模式部署_基于伪分布式模式部署hadoop

基于伪分布式模式部署hadoop

1.hadoop的部署模式

hadoop可以使用不同的模式部署,适用于不同的场景。

单机模式:无需任何守护进程,所有的程序都运行在同一个JVM上执行,一般用于调试MapReduce程序时使用(多用在Windows环境下)。
伪分布式模式:守护进程运行在本地机器上,模拟一个小规模的集群,只有一个NameNode和一个DataNode实例,数据都存放在同一个节点上。“伪”体现在如何本节点出现故障,则数据丢失,而完全分布式可以使用副本机制保证一个节点故障时数据正常访问。伪分布模式也多用在程序调试中。
完全分布式模式:守护进程运行在一个集群上,有一个NameNode和多个DataNode,利用副本机制可以保证当其中一个DataNode节点故障时数据还能正常访问。利用SecondaryNameNode和高可用机制,还可保证整个集群不间断地提供服务。企业应用中hadoop的部署必然是完全分布式模式。

伪分布模式的优势

(1)节省硬件资源:使用一个节点就可以完成集群的搭建。
(2)便于调试:在程序调试阶段可以省去很多服务维护工作,专注于业务研发。

2.伪分布模式安装部署

2.1安装环境

Linux:CentOS 7.2(如果没有实体机可使用虚拟机代替)
JDK:1.8(openjdk或oracle jdk均可,能运行java命令即可)

java -version命令输出如下:

[root@node1 hadoop]# java -version
openjdk version "1.8.0_191"
OpenJDK Runtime Environment (build 1.8.0_191-b12)
OpenJDK 64-Bit Server VM (build 25.191-b12, mixed mode)
  • 1
  • 2
  • 3
  • 4

2.2配置节点名称

设置节点名称为node1
hostnamectl set-hostname node1
/etc/hosts文件中写入节点名称和ip的对应信息
192.168.21.20 node1
hostname命令执行结果为node1

2.3关闭防火墙

systemctl stop firewalld
setenforce 0
# 等效于手动修改/etc/sysconfig/selinux,将其中的SELINUX=enforcing改成SELINUX=disabled
sed 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/sysconfig/selinux
  • 1
  • 2
  • 3
  • 4

2.4配置免密登录

配置免密的目的是让Hadoop的NameNode和DataNode能在没有密码的情况下互相通信。

# 有提示的地方一路按回车
ssh-keygen -t rsa
# 提示输入root用户密码
ssh-copy-id node1
  • 1
  • 2
  • 3
  • 4

测试:如果执行ssh node1不需要密码,即为成功。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/651178
推荐阅读
相关标签
  

闽ICP备14008679号