赞
踩
基于hadoop,数据存储在hdfs上并且对客户端提供hql支持,将hql语句转换为mapreduce任务的数仓工具
存储数据更加像一个数据的管理工具,用户存储各种用于分析的数据 存储的数据量比较庞大的、结构复杂的 、大数据集的管理工具
介绍两种场景,OLTP和OLAP:
OLTP On line Transaction Processing 联机事务处理,倾向于增 删 改
OLAP On line analysis Processing 联机分析处理,倾向于查询
数据仓库:不擅长事务,hive不支持事务;
数据库:mysql支持事务
结构化的一条数据-----表中一行数据
结构化每一个字段-----表中的一个列
对客户端提供hql查询
hql----mapreduce
节省开发成本
这其实是hadoop的特点,因为hive是构建与hdfs之上,所以它继承了这个特点
hive中接口层有以下几种:
将其他语言转换为hive能够识别的语言
元数据是描述hive真实存储数据的数据
hive中表的相关信息(除了表数据以外的信息)
表和hdfs数据的路径对应关系;
表中的字段类型;
表中字段的顺序;
表的创建时间等这些信息就叫做hive的元数据信息
hive的元数据信息存储的时候采用格式化存储,存储在关系型数据库中,默认的元数据存储数据库derby ,derby存储的时候有缺陷,一般生产上换成mysql
hive表数据存储hdfs,元数据存储在关系型数据库
Driver是将hql转化为mapreduce执行的的组件,它由以下几个部分组成&
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。