赞
踩
Spark Streaming源码解读之RDD生成全生命周期彻底研究和思考
DStream是RDD的模板,每隔一个batchInterval会根据DStream模板生成一个对应的RDD。然后将RDD存储到DStream中的generatedRDDs数据结构中。
DStream.scala(86行)
private[streaming]vargeneratedRDDs =newHashMap[Time, RDD[T]]()
用于分析RDD生成的示例代码
val
lines
=
ssc.socketTextStream(
"localhost"
,
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。