当前位置:   article > 正文

Spark RDD(二) RDD的相关行为(Action)操作_spark rdd支持的行动(action)操作有( )areduce(func)bcount(n)

spark rdd支持的行动(action)操作有( )areduce(func)bcount(n)cforeach(func)

Spark RDD(二) RDD的相关行为(Action)操作

Action操作会真正触发转换逻辑(转换操作参见上一篇Spark RDD(一))。本文主要介绍常见的Action操作。

常见Action操作有以下9种:

  • collect()
  • count()
  • first()
  • take(n)
  • reduce(func)
  • takeSample(withReplacement, n, [seed])
  • takeOrdered(n, [ordering])
  • top(n, [ordering])
  • saveAsTextFile(path)
  1. collect() 操作

collect() 会从RDD的每一个partition中手机所有行数据并发送给driver程序。要注意不要对太多数据执行此操作,否则driver程序会报OOM。

例子:

val numberRDD =  spark.sparkContext.parallelize(List(1,2,3,4,5,6,7,8,9,10), 2)
numberRDD.collect()
  • 1
  • 2

输出为:

Array[Int] = Array(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
  • 1
  1. count()操作

count() 操作通过获取每一个partition中的行数并求和来获得一个RDD的行数。

例子:

val numberRDD =  spark.sparkContext.par
    声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/736390
    推荐阅读
    相关标签
      

    闽ICP备14008679号