val pairRDD = lines.flatMap(line => line.split(" ")).map(word => (word, 1))scal..._pairrdd1.reducebykey(_+_).map(_._2).reduce(_+_)的值是___________________">
赞
踩
可以采用多种方式创建Pair RDD,其中一种主要的方式是使用map()函数来实现。
- scala> val lines = sc.textFile("pathToFile")
- scala> val pairRDD = lines.flatMap(line => line.split(" ")).map(word => (word, 1))
- scala> pairRDD.foreach(println)
第二种创建方式:通过并行集合(数组)创建RDD
- scala> val list = List("Hadoop","Spark","Hive")
- scala> val rdd = sc.parallelize(list)
- scala> pairRDD = rdd.map(word => (word,1))
- scala> pairRDD.foreach(println)
scala> pairRDD.reduceByKey((a,b)=>a+b).foreach(println)
比如四个键值对:
scala> val map = Map("spark"->1, "spark"->2, "ha
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。