赞
踩
1、读取csv文件为dataframe格式
data = spark.read
.option("inferSchema","true")#自动推导数据类型
.option("header","true")#读取列名
.csv("/user/root/image.csv")#文件路径
2、dataframe数据保存为csv文件
data.coalesce(1)#文件分区设置为1
.write.mode("overwrite")#保存方式为覆盖
.option("mapreduce.fileoutputcommitter.marksuccessfuljobs","false")#保存csv文件时去除success文件
.option("header","true")#保存表列名
.option("delimiter", "\001")#指定分隔符
.csv("/user/root/data")#保存文件的路径
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。