赞
踩
Hive是一个基于Hadoop的数据仓库工具, 可以将结构化的数据文件映射为一张表, 并提供类似于SQL的查询功能。
Hive本身并不存储和处理数据,更像是一个接口,存储由HDFS实现,处理数据由MapReduce实现。简单来说,Hive可以将sql语句转换为MapReduce任务, 在HDFS上进行数据查询。
(图源:https://zhuanlan.zhihu.com/p/25608332)
Hive主要由以下三个模块组成:
接下来,我们使用一个小例子来理解Hive如何将sql语句转换为M
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。