赞
踩
什么是Hbase?
Hbase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用Hbase技术可在廉价PC Server上搭建起大规模结构化存储集群。
Hbase的目标是存储并处理大型的数据,更具体的来说是仅需要使用普通的硬件配置,就能够处理由成千上万的行和列所组成的大型数据。
Hbase的架构体系
Hbase有三个核心组件:分别是Zookeeper 、MasterServer 和RegionServe
整个Hbase数据库都可以实现高可用性,每一个组件都可以拥有多个集群节点,最大程度防止单点故障。
HDFS只能创建删除文件,不能实时更新文件,基于HDFS Hbase可以update文件。
Hbase的ZK和Master服务集群
Master Server是整个Hbase的管理节点
用于处理性能压力负载到每一个Rs服务器上
任何的数据表的创建和列创建都由其负责
可以部署成一主多备模式
ZK负责主从选举和元数据同步,生产环境建议三副本起
Hbase的Region服务集群
Region Server是用于和客户端进行数据交互的节点
RS控制不同数据表的大小尺寸
对每一个表提供读写的具体操作
多台RS可以组成高可用集群
操作RS时数据会先进入Memstore内存区,统一写回到Hfile中
Hbase的数据表存储方式
Hbase数据是存储在HDFS文件系统之上,由Hadoop提高底层的数据文件支持,数据的变更读写在Hbase自己托管的Hfile中完成
Hbase的内部列式存储结构
Hbase数据库不同于SQL类数据库,采用列示存储。
表是行的集合
行是一组列族的集合
列族是一组列的集合
列是键值对的集合
常见的Hbase命令集
creat创建表
Drop删除表
Put加入数据
Scan/Get获取数据
delete删除数据
list查询系统信息
count统计信息
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。