赞
踩
一、hive是什么
简单来说,hive就是在Hadoop上架了一层SQL接口,可以将SQL翻译成MapReduce去Hadoop上执行,这样使得数据开发和分析人员很方便的使用SQL来完成海量数据统计与分析,二不必使用编程语言开发MapReduce那么麻烦
二、Hive与mysql的区别
1.查询语言不同:hive是hql语言,mysql是sql语言
2.数据存储位置不同:hive是把数据存储到hdfs,而mysql数据存储在自己的系统中
3.数据格式:hive数据格式可以用户自定义,mysql有自己的系统定义格式
4.数据更新:hive不支持数据更新,只可以读,不可以写,sql支持数据的读写
5.索引:hive没有索引,因此查询数据的时候是通过mapreduce很暴力的把数据都查询一遍,也造成了hive查询数据速度很慢的原因,而mysql有索引;
6.延迟性:hive没有索引,因此查询数据的时候通过mapreduce很暴力 的把数据都查询一遍,也造成了hive查询数据速度很慢的原因,而mysql有索引;
7、数据规模:hive存储的数据量超级大,而mysql只是存储一些少量的业务数据
8.底层执行原理:hive底层是用的mapreduce,而mysql是excutor执行器;
三、总结一下
Hive 具有 SQL 数据库的外表,但应用场景完全不同,Hive 只适合用来做海量离线数 据统计分析,也就是数据仓库。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。