赞
踩
任务描述
本关任务:编写一个SparkSQL程序,完成加载和保存数据。
相关知识
为了完成本关任务,你需要掌握:
加载数据
直接在文件上运行SQL
保存到路径
保存模式介绍
保存到持久表
存储和排序或分区
加载数据
DataFrameReader用于从外部存储系统(例如文件系统,键值存储等)加载数据集的接口。使用SparkSession.read来访问它。
DataFrameReader提供了(json,parquet,jdbc,orc,libsvm,csv,text)格式支持,DataFrameReader.load(String… paths)方法支持多个路径的数据源,默认使用parquet格式(除非另有配置,spark.sql.sources.default)用于所有操作
package com.educoder.bigData.sparksql2;
import org.apache.spark
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。