赞
踩
本教程将通过一个具体的案例来演示如何在Spark SQL中操作数据帧。我们将从获取学生数据帧开始,包括两种方法:一是由数据集转换而来,二是直接读取文件生成数据帧。然后,我们将对数据帧进行各种操作,如投影、过滤、统计和排序等。
具体步骤如下:
由数据集转换而来的方法
toDF()
方法得到数据帧。直接读取文件生成数据帧的方法
option().csv()
方法读取文本文件生成数据帧。操作学生数据帧
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。