赞
踩
hive源码地址在github或gitee均可以下载,如果没有vpn工具,使用gitee网速更快点。
github地址为:
https://github.com:edingbrugh/hive.git
gitee地址如下:
https://gitee.com/apache/hive.git
本地编译hvie项目,在本地编译hive项目之前首先需要确保有一个可用的hive环境,才能进行源码调试。
# 下载hive项目
git clone https://gitee.com/apache/hive.git
# 进入clone的hive根目录
cd hive
# 编译hive项目
mvn clean package -DskipTests -Pdist
将编译好的hive项目导入idea中,导入后的hive项目目录如下
将hive项目导入idea后,还需要配置源码调试入口。配置流程如下:Run -> Edit Configurations -> + -> Remote JVM Debug。然后配置远程的ip和port即可。
在已经安装的hive机器上开启debug模式,开启debug模式之后,会卡住如果没有配置、运行Idea的Remote JVM Debug。开启debug如下:
bin/hive --debug -hiveconf hive.root.logger=DEBUG,console
启动后即可获取debug的端口,如下
hive的cli的入口为CliDriver#main
org.apache.hadoop.hive.cli.CliDriver
以下为在hive-cli中执行show databases的调试。
至此hive源码调试环境已经搭建完成,可以从CliDriver#main方法作为入口一步步调试了解hive sql如何解析、校验、最后转化MR的流程。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。