赞
踩
1、HBase是一个分布式的、面向列的开源数据库,HBase在Hadoop之上提供了类似于Bigtable的能力。是Apache的Hadoop项目的子项目。
2、HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
3、HBase专用于海量数据的存储与海量数据的查询,可以在数十亿上百亿条记录的表中实现秒级别的查询速度,这是传统关系数据库不能比拟的。
4、HBase各个组件功能介绍
Client
• 包含访问HBase的接口并维护cache来加快对HBase的访问
Zookeeper
• 保证任何时候,集群中只有一个master
• 存贮所有Region的寻址入口。
• 实时监控Region server的上线和下线信息。并实时通知Master
• 存储HBase的schema和table元数据
Master
• 为Region server分配region
• 负责Region server的负载均衡
• 发现失效的Region server并重新分配其上的region
• 管理用户对table的增删改操作
RegionServer
• Region server维护region,处理对这些region的IO请求
• Region server负责切分在运行过程中变得过大的region
建议大家选择稳定的CDH发行版本下载,这里是官网下载链接https://archive.cloudera.com/cdh5/cdh/5/
我目前使用的是HBase0.98版本,在选择下载包的时候要选择那个最大的编译好的GZ包进行下载
下载好后tar -zxvf hbase-0.98.6-cdh5.3.6.tar.gz -C 目的目录
解压好即可。
HBase的配置文件在我们的安装目录下的conf
文件夹下
在这个文件中我们只要设置好JAVA环境变量的值就可以,修改
export JAVA_HOME=/opt/module/jdk1.7.0_67
这里我们安装官方文档解释进行设置
<property>
<name>hbase.rootdir</name>
<value>hdfs://hadoop:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>hadoop,slave1,slave2</value>
</property>
其中rootdir中的hdfs地址我们要设置自己的机器名和namenode端口号,最后一项就是我们分布式的各个机器,如果是单机版可以只设置本机。
hadoop
slave1
slave2
单机版可以不配置。
先启动好HDFS,进入HBase安装目录下输入bin/start-hbase.sh
启动,输入jps
可以看到多了几个我们刚刚提到的组件的进程:
进入web的60010端口可以看到已经部署成功:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。