当前位置:   article > 正文

利用spark将parquet文件转存储为CSV文件_spark 读取parquet 转成csv

spark 读取parquet 转成csv
  1. from pyspark import SparkConf
  2. from pyspark.sql import SparkSession
  3. #创建spark会话
  4. spark = SparkSession.builder.getOrCreate()
  5. parquetfile='parquet_file_name.parquet'
  6. df=spark.read.parquet(curfile) #读取parquet文件
  7. # df.printSchema()
  8. #显示第一行
  9. # print(df.first())
  10. df.write.option("header",True) .csv("jupyter_workspace/data/20220831")
  11. #参考 https://sparkbyexamples.com/pyspark/pyspark-write-dataframe-to-csv-file/

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/516030
推荐阅读
相关标签
  

闽ICP备14008679号