当前位置:   article > 正文

HBase 伪分布式环境搭建_hbase伪分布式环境搭建

hbase伪分布式环境搭建

第1关:伪分布式环境搭建

任务描述

本关任务:安装伪分布式HBase

相关知识

上次实训中我们已经完成了单机版HBase的安装,单机版意味着我们的HBase数据仍然是存放在本地,而没有存放在Hadoop集群中,本关我们来学习如何配置一个伪分布式的HBase环境,伪分布式意味着HBase仍然在单个主机上运行,但每个HBase守护程序HMasterHRegionServerZookeeper)作为单独的进程运行;在伪分布式的环境下,我们会将HBase的数据存储在HDFS中,而不是存放在本地了,接下来我们就来一起搭建环境吧。

实验环境:

hadoop2.7; JDK8; HBase2.1.1; hadoop已安装; JDK已安装,环境变量已配置; HBase压缩包已下载,存放在/opt目录下。

在搭建环境之前我们首先来了解一下HBase分布式环境的整体架构:

我们来简单认识一下与HBase的相关组件:

Zookeeper

Zookeeper能为HBase提供协同服务,是HBase的一个重要组件,Zookeeper能实时的监控HBase的健康状态,并作出相应处理。

HMaster:

HMasterHBase的主服务,他负责监控集群中所有的HRegionServer,并对表和Region进行管理操作,比如创建表,修改表,移除表等等。

HRegion:

HRegion是对表进行划分的基本单元,一个表在刚刚创建时只有一个Region,但是随着记录的增加,表会变得越来越大,HRegionServer会实时跟踪Region的大小,当Region增大到某个值时,就会进行切割(split)操作,由一个Region切分成两个Region

HRegionServer:

HRegionServerRegionServer的实例,它负责服务和管理多个HRegion 实例,并直接响应用户的读写请求。

总的来说,要部署一个分布式的HBase数据库,需要各个组件的协作,HBase通过Zookeeper进行分布式应用管理,Zookeeper相当于管理员,HBase将数据存储在HDFS(分布式文件系统)中,通过HDFS存储数据,所以我们搭建分布式的HBase数据库的整体思路也在这里,即将各个服务进行整合。

接下来,我们就一起来搭建一个伪分布式的HBase。

配置与启动伪分布式HBase

1.     mkdir /app
2.     cd /opt
3.     ulimit -f 1000000
4.     tar -zxvf hbase-2.1.1-bin.tar.gz -C /app
安装单机版很简单,我们只需要配置JDK的路径即可,我们将JDK的路径配置到conf/下的hbase-env.sh中。

我们先输入echo $JAVA_HOME来复制JAVA_HOME的路径,以方便之后的配置:

接着我们编辑HBase conf目录下的hbase-env.sh文件,将其中的JAVA_HOME指向到你Java的安装目录,最后保存设置:

cd /app/hbase-2.1.1
vim /app/hbase-2.1.1/conf/hbase-env.sh

如果你已经完成了单节点HBase的安装,那伪分布式的配置对你来说应该很简单了,只需要修改hbase-site.xml文件即可:

 
  1. vim /app/hbase-2.1.1/conf/hbase-site.xml

在这里主要有两项配置:

1.开启HBase的分布式运行模式,配置hbase.cluster.distributedtrue代表开启HBase的分布式运行模式:

 
  1. <property>
  2. <name>hbase.cluster.distributed</name>
  3. <value>true</value>
  4. </property>

2.是设置HBase的数据文件存储位置为HDFS/hbase目录,要注意的是在这里我们不需要在HDFS中手动创建hbase目录,因为HBase会帮我们自动创建。

 
  1. <property>
  2. <name>hbase.rootdir</name>
  3. <value>hdfs://localhost:9000/hbase</value>
  4. </property>

修改之后hbase-site.xml<configuration>代码:

<configuration>
<property>
  <name>hbase.rootdir</name>
  <value>hdfs://localhost:9000/hbase</value>
</property>
<property>
  <name>hbase.zookeeper.property.dataDir</name>
  <value>/root/data/hbase/zookeeper</value>
</property>
<property>
  <name>hbase.unsafe.stream.capability.enforce</name>
  <value>true</value>
</property>
<property>
  <name>hbase.cluster.distributed</name>
  <value>true</value>
</configuration>
 

标红部分为我们需要注意的配置。我们在设置单节点的时候将hbase.unsafe.stream.capability.enforce属性值设置为了false,在这里我们需要注意设置它的值为true,或者干脆删除这个属性也是可以的。

配置完成之后,我们需要先启动Hadoop,命令为:start-dfs.sh,然后启动HBase,最后输入jps查看启动的进程:

如果出现HMasterHRegionServer以及HQuorumPeer三个服务则代表伪分布式环境已经搭建成功了。

在HDFS中验证

接下来我们进一步验证:在HDFS中检查HBase文件。

如果一切正常,HBase会在HDFS中自动建立自己的文件,在上述配置文件中,设置的文件位置为/hbase,我们输入hadoop fs -ls /hbase即可查看,如下图所示,分布式文件系统(HDFS)中hbase文件夹已经创建了:

编程要求

好了,到你啦,你需要先按照上次实训——HBase单节点安装的方式将HBase安装在/app目录下,然后根据本关知识配置好伪分布式的HBase,最后点击测评即可通关。

测试说明

程序会检测你的HBase服务和Hadoop服务是否启动,以及伪分布式HBase是否配置正确。

预期输出:

Hadoop 已启动 hbase-env.sh解压路径正确 Hbase已启动 各配置项配置成功! Hbase的HDFS目录创建成功 伪分布式搭建成功!


开始你的任务吧,祝你成功!

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号