当前位置:   article > 正文

菜鸟教程_Hbase教程菜鸟教程:Hadoop Hbase入门简介

hbase菜鸟教程

在Hadoop系统框架当中,大家所熟知的HDFS是分布式文件系统,而Hbase才是数据存储的数据库,这两者之间的联系是非常紧密的,Hbase使用HDFS作为分布式数据存储。关于分布式存储,Hbase的重要性不言而喻,那么今天我们就来为大家分享Hbase教程菜鸟教程。
传统数据的数据处理,主要是关系型数据库,这样的数据库在面对大规模的数据存储任务时,就出现了明显的不足,大数据时代的数据,规模大、新增快、格式多样,因此传统的关系型数据库已经不能适应新的需求。

d90178472261e41d9bc2cff7d4571402.png


在这样的背景下,非关系型数据库开始成为主流的选择,而为了更大地拓展数据存储潜力,Google首先研发了BigTable,这也是Hbase的原型。
Hbase是一个面向列的非关系型数据库,弱化了传统的表结构,而是采取Column Family(常译为列族/列簇)来对数据进行分类。一个列族包含多个列,一个列族的多个列之间通常也具有某种关系,比如相似或同种类别。所以列族可以看作是某种分类(归类)。
每个类别里都会有具体的信息,它们就相当于一个个标识符(变量名),在Hbase中叫做Column Qualifier(列修饰符)。列修饰符位于列族里面用来标识一条条数据。
在Hbase中一个列族(Column Family)和一个列修饰符(Column Qualifier)组合起来才叫一个列(Column),使用冒号(:)分割,列族:列修饰符。
在传统数据库中每一行的唯一标识符叫做主键,在Hbase中叫做row key(行键)。数据在进入Hbase时都会被打上一个时间戳,这个时间戳可以作为版本号来使用。
一个行键、列族、列修饰符、数据和时间戳组合起来叫做一个单元格(Cell)。这里的行键、列族、列修饰符和时间戳其实可以看作是定位属性(类似坐标),最终确定了一个数据。
今天的Hbase教程菜鸟教程,主要是对于Hbase的数据存储结构方面的简介,Hbase与HDFS联合起来,是Hadoop实现分布式存储的基石,在整个Hadoop生态系统当中的重要性非同一般。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/776590
推荐阅读
相关标签
  

闽ICP备14008679号