赞
踩
本节介绍如何编写 Spark Streaming 应用程序,由简到难讲解使用几个核心概念来解决实际应用问题。
在实例演示中模拟实际情况,需要源源不断地接入流数据,为了在演示过程中更接近真实环境,首先需要定义流数据模拟器。该模拟器的主要功能是通过 Socket 方式监听指定的端口号,当外部程序通过该端口进行连接并请求数据时,模拟器将定时将指定的文件数据进行随机获取,并发送给外部程序。
流数据模拟器的代码如下。
在 IDEA 开发环境打包配置界面中:
cd /home/hadoop/IdeaProjects/out/artifacts/LearnSpark_j
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。