赞
踩
hive数据仓库与MYSQL数据的区别
hive:
属于大数据生态系统中一个技术框架、用于分析数据
数据仓库ETL工具(ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程)
建立在Hadoop之上,为用户提供SQL语句分析海量数据,离线数据分析
底层MapReduce
类似于MYSQL数据库中database和table来组织数据
hive将元数据存储在MYSQL中。
mysql:
属于RDBMS中关系型数据库的一种
数据存储和数据检索
表的数据量不大
区别:
MYSQL是检索数据,hive管理数据,偏向于分析数据
1.查询语言不同:hive是hql语言,mysql是sql语句;
2.数据存储位置不同:hive是把数据存储在hdfs上,而mysql数据是存储在自己的系统中;
3.数据格式:hive数据格式可以用户自定义,mysql有自己的系统定义格式;
4.数据更新:hive不支持数据更新,只可以读,不可以写,而sql支持数据更新;
5.索引:hive没有索引,因此查询数据的时候是通过mapreduce很暴力的把数据都查询一遍,也造成了hive查询数据速度很慢的原因,而mysql有索引;
6.延迟性:hive延迟性高,原因就是上边一点所说的,而mysql延迟性低;
7.数据规模:hive存储的数据量超级大,而mysql只是存储一些少量的业务数据;
8.底层执行原理:hive底层是用的mapreduce,而mysql是excutor执行器;
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。