当前位置:   article > 正文

hive数据仓库与MYSQL数据的区别_mysql 和hive 的区别

mysql 和hive 的区别

hive数据仓库与MYSQL数据的区别

hive:

属于大数据生态系统中一个技术框架、用于分析数据

数据仓库ETL工具(ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程)

建立在Hadoop之上,为用户提供SQL语句分析海量数据,离线数据分析

底层MapReduce

类似于MYSQL数据库中database和table来组织数据

hive将元数据存储在MYSQL中。

mysql:

属于RDBMS中关系型数据库的一种

数据存储和数据检索

表的数据量不大

区别:

MYSQL是检索数据,hive管理数据,偏向于分析数据

1.查询语言不同:hive是hql语言,mysql是sql语句

2.数据存储位置不同:hive是把数据存储在hdfs上,而mysql数据是存储在自己的系统中;

3.数据格式:hive数据格式可以用户自定义,mysql有自己的系统定义格式;

4.数据更新:hive不支持数据更新,只可以读,不可以写,而sql支持数据更新;

5.索引:hive没有索引,因此查询数据的时候是通过mapreduce很暴力的把数据都查询一遍,也造成了hive查询数据速度很慢的原因,而mysql有索引;

6.延迟性:hive延迟性高,原因就是上边一点所说的,而mysql延迟性低;

7.数据规模:hive存储的数据量超级大,而mysql只是存储一些少量的业务数据;

8.底层执行原理:hive底层是用的mapreduce,而mysql是excutor执行器;

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/529212
推荐阅读
相关标签
  

闽ICP备14008679号