赞
踩
1、foreach操作:对RDD中的每个元素执行f函数操作,返回Unit。
def funOps1(): Unit = {
var rdd1 = sc.parallelize(List(1, 2, 3, 5, 6))
rdd1.foreach(println _)
}
源码:
2、saveAsTextFile操作:将数据输出到hdfs上,将RDD中的每个元素映射转变为(Null, e.toString),然后将其写入HDFS。RDD的每个分区存储为HDFS中的一个Block。
def funOps2(): Unit = {
var rdd1 = sc.parallelize(List(1, 2, 3, 5, 6))
var rdd2 = rdd1.map(_ + 1)
rdd2.saveAsTextFile(
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。