赞
踩
官网地址:https://hive.apache.org/
源码地址:https://github.com/apache/hive
Apache社区统一下载地址:https://archive.apache.org/dist/
Hive是使用SQL方法进行大数据量的统计分析【适合离线场景/批处理场景】
执行流程:SQL => Hive => 翻译成MR作业 => 提交到YARN上去执行
区别:
1)Hive on Spark:SQL基于HIVE,翻译成SPARK作业 【在Hive框架中】
2) Spark SQL:直接在Spark框架中写的sql作业 【在Spark框架中】
Hive | RDBMS |
---|---|
面向SQL | 面向SQL |
统计分析,延时性比较高 | “实时”:快速响应,延时性很短 |
支持事务(一般Hive不用) | 支持事务 |
load加载批量数据进Hive,也支持insert、update等 | insert、update等 |
MR/Spark/Tez分布式 | 分布式 |
节点数可以很多 | 节点数偏少 |
廉价的机器 | 专用的机器 |
P+ | 。。。。。。 |
[root@maggie ~]$ chown -R xiaofeng:xiaofeng /home/xiaofeng/software/
//切换成xiaofeng用户
[hadoop@maggie software]$ tar -xzvf /apache-hive-3.1.2-bin.tar.gz -C ../app/
......(解压过程省略)
[xiaofeng@maggie101 app]$ ln -s apache-hive-3.1.2-bin hive 【设置软连接】
[xiaofeng@maggie101 ~]$ vi .bashrc
export HIVE_HOME=/home/xiaofeng/app/hive
export PATH=$HIVE_HOME/bin:$PATH
[xiaofeng@maggie101 ~]$ sources .bashrc 【使环境变量生效】
[xiaofeng@maggie101 hive]$ ll 【再创建一个logs日志文件夹】
total 76
drwxrwxr-x 3 xiaofeng xiaofeng 4096 Nov 24 22:07 bin 【脚本相关】
drwxrwxr-x 2 xiaofeng xiaofeng 4096 Nov 24 22:07 binary-package-licenses
drwxrwxr-x 2 xiaofeng xiaofeng 4096 Nov 24 22:07 conf 【配置文件相关,尤其是hive-site
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。