当前位置: article > 正文

hive sql 怎么实现循环_Hive存储过程实现-hpsql

作者：知新_RL | 2024-03-01 21:10:39

踩

hive 实现循环

1. 什么是hpsql

目前版本的hive中没有提供类似存储过程的功能，使用Hive做数据开发时候，一般是将一段一段的HQL语句封装在Shell或者其他脚本中，然后以命令行

的方式调用，完成一个业务或者一张报表的统计分析。好消息是，现在已经有了Hive存储过程的解决方案(HPL/SQL –Procedural SQL on hadoop)，并

且在未来的Hive的版本(2.0)中，会将该模块集成进来。该解决方案不仅支持Hive，还支持在SparkSQL，其他NoSQL，甚至是RDBMS中使用类似于

Oracle PL/SQL的功能，这将极大的方便数据开发者的工作，Hive中很多之前比较难实现的功能，现在可以很方便的实现，比如自定义变量、基于一个结果集的游标、循环等等。

2. 安装配置hpsql

2.1 下载软件

也可以从我的云盘下载链接是：https://pan.baidu.com/s/1i5mTBEH 密码是：xbf

2.2 安装配置hpsql

mkdir /opt/hpsql

tar -zxf hplsql-0.3.17.tar.gz -C /opt/hpsql

2.2.1 进入hplsql安装目录，配置 HADOOP_CLASSPATH

vi hplsql

2.2.2 进入hive安装目录，配置和启动Hive的thrift服务HiveServer2

本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】