赞
踩
第一节. 概述
第二节. HBase访问接口
第三节.HBase数据模型
第四节. HBase的实现原理
第五节.HBase运行机制
第六节.应用方案
第七节.HBase编程实践
一、概述
1.简介
HBase是谷歌BigTable的开源实现。
HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库。
HBase主要用来存储非结构化和半结构化的松散数据。
Hbase架构在HDFS之上,HDFS是存储完全非结构化数据
HBase的目标是处理非常庞大的表,可以通过水平扩展的方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表。
2.HBase与传统的关系数据库的区别主要体现在以下几个方面:
(1)数据类型:关系数据库采用关系模型,具有丰富的数据类型和存储方式;HBase则采用了更加简单的数据模型,它把数据存储为未经解释的字符串,在java中就是字节数组Bytes;
(2)数据操作:关系数据库中包含了丰富的操作,其中会涉及复杂的多表连接。HBase操作则不存在复杂的多表连接,只有简单的插入、查询、删除、清空等,因为HBase在设计上就避免了复杂的多表连接;
(3)存储模式:关系数据库是基于行模式存储的。HBase是基于列存储的,每个列族都由几个文件保存,不同列族的文件是分离的。
(4)数据索引:关系数据库通常可以针对不同列构建复杂的多个索
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。