当前位置:   article > 正文

hiveserver2服务的启动与简单使用技巧

hiveserver2

一、hiveserver2简介
    Hive在生产上是不需要部署集群的,操作Hive只需要通过它提供的客户端即可,Hive提供了大致三类客户端:

hive shell:通过hive shell来操作hive,但是至多只能存在一个hive shell,启动第二个会被阻塞,也就是说hive shell不支持并发操作。
WebUI: 通过HUE/Zeppelin来对Hive表进行操作。
基于JDBC等协议:启动hiveserver2,通过jdbc协议可以访问hive,hiveserver2支持高并发
简而言之,hiveserver2是Hive启动了一个server,客户端可以使用JDBC协议,通过IP+ Port的方式对其进行访问,达到并发访问的目的。

二、使用hiveserver2服务
本次演示使用的Hive版本是:apache-hive-3.1.2,开发工具是IDEA2021

1.启动hiveserver2服务

启动Hiveserver2有两种命令:

hive的bin目录下执行 hive --service hiveserver2

或者
hive的bin目录下执行  ./hiveserver2,

hiveserver2的服务端口默认是10000,WebUI端口默认是10002,这2个都可以在hive-site.xml中配置

我们新开一个终端使用命令netstat -anop|grep 10000 和 netstat -anop|grep 10002:

说明服务端口和web端口都在监听状态,启动正常

我们在浏览器访问 http://master104:10002/,可以看到如下图的界面

2.启动beeline连接server

在装了相同版本Hive的其他主机(启动hiveserver2的主机也可以)上启动beeline,可以连接到Hive的server上。执行命令:beeline -u jdbc:hive2://master104:10000

 连接成功,我们刷新web管理端,可以看到一条连接信息

 我们在beeline终端执行 show databases;输出了结果

 同时刷新web端,可以看到执行了一个mr任务

我们可以使用beeline完成在hive shell中相同的操作。

3.使用JDBC协议连接server

我们打开idea,新建一个maven项目,在pom文件添加依赖

  1. <dependencies>
  2. <dependency>
  3. <groupId>junit</groupId>
  4. <artifactId>junit</artifactId>
  5. <version>4.12</version>
  6. </dependency>
  7. <dependency>
  8. <groupId>org.apache.hive</groupId>
  9. <artifactId>hive-jdbc</artifactId>
  10. <version>3.1.2</version>
  11. </dependency>
  12. </dependencies>

我们在src下面新建一个测试类HiveTest,输入代码如下

  1. import org.junit.After;
  2. import org.junit.Before;
  3. import org.junit.Test;
  4. import java.sql.Connection;
  5. import java.sql.DriverManager;
  6. import java.sql.PreparedStatement;
  7. import java.sql.ResultSet;
  8. public class HiveTest {
  9. //连接
  10. private Connection connection = null;
  11. private PreparedStatement preparedStatement = null;
  12. private ResultSet resultSet = null;
  13. /**
  14. * 建立连接
  15. */
  16. @Before
  17. public void before(){
  18. try {
  19. //Hive的JDBC驱动
  20. String classDriver = "org.apache.hive.jdbc.HiveDriver";
  21. //连接串,接数据库名mydb,数据库写你的数据库
  22. String url = "jdbc:hive2://master104:10000/default";
  23. //加载驱动
  24. Class.forName(classDriver);
  25. //获得连接
  26. connection = DriverManager.getConnection(url);
  27. }catch (Exception e){
  28. e.printStackTrace();
  29. }
  30. }
  31. /**
  32. * 查询表中的数据
  33. */
  34. @Test
  35. public void testHiveSelect(){
  36. try {
  37. //表和数据需要提前准备好
  38. String sql = "select * from test0727";
  39. //执行SQL语句
  40. preparedStatement = connection.prepareStatement(sql);
  41. //得到结果集
  42. resultSet = preparedStatement.executeQuery();
  43. //遍历结果集
  44. while (resultSet.next()){
  45. System.out.println(resultSet.getInt(1) + " " + resultSet.getString(2));
  46. }
  47. }catch (Exception e){
  48. e.printStackTrace();
  49. }
  50. }
  51. /**
  52. * 结束后关闭连接
  53. */
  54. @After
  55. public void after(){
  56. try {
  57. if (preparedStatement != null)
  58. preparedStatement.close();
  59. if (resultSet != null)
  60. resultSet.close();
  61. connection.close();
  62. }catch (Exception e){
  63. e.printStackTrace();
  64. }
  65. }
  66. }

这个方法会查询hive上的默认库default下面的表test0727,里面有3条记录

 我们执行单元测试 testHiveSelect,

 在控制台得到下面结果

 这里只是演示了查询Hive表的select查询操作,你会发现,代码和操作MysQL的代码一模一样,仅仅只是驱动不一样,这得益于Java的多态,MySQL和Hive都实现了JDBC的借口,所以在方法的调用层面上,二者是完全一样的!还有表的其他操作比如删除,排序等等也和操作MySQL的一致,这里就不多作介绍了,读者可以自行写测试代码来体验下。
通过查看WebUI,可以看到我们执行查询的操作记录:

 三、总结

Hive的hiveserver2服务本质上是实现了JDBC的接口,所以我们可以各种方式使用JDBC连接它,在终端可以使用beeline,连接Hive的server2,用法和hive shell一致,而编程则可以加载Hive的JDBC驱动,使用操作其他关系型数据库的方法操作Hive


        感谢能看到这里的朋友

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/人工智能uu/article/detail/745448
推荐阅读
相关标签