赞
踩
一、 虚拟机及ubuntu安装 参考这位博主所写 “在Windows系统下安装VirtualBox与Ubuntu的详细教程”
https://blog.csdn.net/zcooa/article/details/80615743
二、 Hadoop安装前的准备工作
sudo useradd -m hadoop -s /bin/bash
sudo passwd hadoop
sudo adduser hadoop sudo
sudo apt-get update
sudo apt-get install openssh-server
ssh localhost
可以登陆本机,首次执行该命令会出现登陆提示信息,输入yes;再根据提示输入密码,就可以登陆到本机。cd ~/.ssh/
然后 ssh-keygen -t rsa
之后一直按回车键直到再次出现提示操作 再输入 cat ./id_rsa.pub >> ./authorized_keys
ssh localhost
命令 不必输入密码就可以登陆了。:sudo tar -zxf ~/下载/jdk-8u221-linux-64.tar.gz -C /usr/lib/jvm
下。vim ~/.bahsrc
按i进入编辑模式,在文件最前面添加如下单独一行 export JAVA_HOME=/usr/lib/jvm/jdk-8u221
,接下来让环境变量立即生效:source ~/.bashrc
echo $JAVA_HOME
java -version
$JAVA_HOME/bin/java -version
至此,JAVA环境配置完成。
三、hadoop安装配置(伪分布式)
sudo tart -zxf ~/下载/hadoop-3.2.1.tar.gz -C /usr/lcoal
cd /usr/local/
sudo mv ./hadoop-3.2.1/ ./hadoop #将文件夹名改为hadoop
sudo chown -R hadoop ./hadoop #修改文件权限
cd /usr/local/hadoop
./bin/hadoop version
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/hadoop/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
完成后,按键盘的Esc键,再输入:wq,代表保存退出。
需要注意的是file:描述的文件夹是必须先存在的,因此在配置前先在该目录建立该文件夹。
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/tmp/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/tmp/dfs/data</value>
</property>
注意:dfs.replication的值表示副本数目。/usr/local/hadoop/tmp/dfs/name和/usr/local/hadoop/tmp/dfs/data这两个文件也必须是已经存在的,即要先新建。
cd /usr/local/hadoop
./bin/hdfs namenode -format
如果格式化成功,会看见has been successfully formatted信息
cd /usr/local/hadoop
./sbin/start-dfs.sh
出现提示信息输入yes即可。如果启动过程中出现非常多的 “ssh:could not resolve hadtname xxx”可通过设置hadoop环境变量来解决。
vim ~/.bashrc
export HADOOP_HOME=/usr/local/hadoop
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/LIB/native
source ~/.bashrc
然后再执行命令
cd /usr/local/hadoop
./sbin/start-dfs.sh
通过输入jps判断启动是否成功,若成功,则会显示NameNode,DataNode,SecondaryNameNode
至此,linux环境下的hadoop伪分布式安装与配置完成。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。