当前位置:   article > 正文

pycharm pyspark连接虚拟机的hive表 读取数据

pycharm pyspark连接虚拟机的hive表 读取数据

方法:

hive配置hiveserver2和metastore url

  1. <!-- 指定hiveserver2连接的host -->
  2. <property>
  3. <name>hive.server2.thrift.bind.host</name>
  4. <value>hadoop111</value>
  5. </property>
  6. <!-- 指定hiveserver2连接的端口号 -->
  7. <property>
  8. <name>hive.server2.thrift.port</name>
  9. <value>10000</value>
  10. </property>
  11. <!-- 指定存储元数据要连接的地址 -->
  12. <property>
  13. <name>hive.metastore.uris</name>
  14. <value>thrift://hadoop111:9083</value>
  15. </property>

启动metastore

hive --service metastore

启动hiveserver2

hive --service hiveserver2

python代码

给个demo示例:

  1. from pyspark.sql import SparkSession
  2. # 创建 SparkSession
  3. spark = SparkSession \
  4. .builder \
  5. .appName("HiveConnectionExample") \
  6. .config("spark.sql.warehouse.dir", "hdfs://192.168.10.111:8020/user/hive/warehouse") \
  7. .config("hive.metastore.uris", "thrift://192.168.10.111:9083") \
  8. .enableHiveSupport() \
  9. .getOrCreate()
  10. # 读取 Hive 表
  11. # df = spark.sql("SELECT * FROM a")
  12. df = spark.sql("show tables")
  13. df.show()
  14. # 关闭 SparkSession
  15. spark.stop()

运行成功

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/396198
推荐阅读
相关标签
  

闽ICP备14008679号