当前位置:   article > 正文

Spark学习(六):Spark SQL二_spark sql write format

spark sql write format

目录

4.数据的read、write和savemode

4.1 数据的读取

4.2 数据的写出

4.3  数据保存的模式

5. Spark SQL数据源

5.1 数据源之json

5.2 数据源之parquet

5.3 数据源之csv

5.4 数据源之JDBC

5.5 数据源之hive


4.数据的read、write和savemode

4.1 数据的读取

一些常见的数据源,parquet:是之前输出parquet文件的目录,读取该目录下的所有文件

student.json

{"name":"jack", "age":"22"}
{"name":"rose", "age":"21"}
{"name":"mike", "age":"19"}

 product.csv

phone,5000,100
xiaomi,3000,300

  1. val spark = SparkSession.builder()
  2. .master("local[*]")
  3. .appName(this.getClass.getSimpleName)
  4. .getOrCreate()
  5. //方式一:
  6. val jsonSource: DataFrame = spark.read.json("E:\\student.json")
  7. val csvSource: DataFrame = spark.read.csv("e://product.csv")
  8. val parquetSource: DataFrame = spark.read.parquet("E:/parquetOutput/*")
  9. //方式二:
  10. val jsonSource1: DataFrame = spark.read.format("json").load("E:\\student.json")
  11. val csvSource1: DataFrame = spark.read.format("csv").load("e://product.csv")
  12. val parquetSource1: DataFrame = spark.read.format("parquet").load("E:/parquetOutput/*")
  13. //方式三:默认是paprquet格式
  14. val df: DataFrame = spark.sqlContext.load("E:/parquetOutput/*")

4.2 数据的写出

  1. //方式一:
  2. jsonSource.write.json("./jsonOutput")
  3. jsonSource.write.parquet("./parquetOutput")
  4. jsonSource.write.csv("./scvOut")
  5. //方式二:
  6. jsonSource.write.format("json").save("./jsonOutput")
  7. jsonSource.write.format("parquet").save("./parquetOutput")
  8. jsonSource.write.format("csv").save("./scvOut")
  9. //方式三:默认parquet格式
  10. jsonSource.write.save("./parquetOutput")

4.3  数据保存的模式

result1.write.mode(SaveMode.Append).json("spark_day01/jsonOutput1")
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/木道寻08/article/detail/785608
推荐阅读
相关标签
  

闽ICP备14008679号