当前位置:   article > 正文

Spark——期末考试大作业:求top值、文件排序、二次排序程序个性化

求top值


   说明:本次大作业是基于ubuntukylin14.04(16)版本即hadoop集群(hadoop2.6.0版本)和hbase伪分布式(hbase1.1.2版本),并安装好Scala2.11.8、Spark2.1.0、sbt0.13.15和Scala IDE for eclipse4.7.0,并完成了sbt eclipse插件的全局安装,在实验报告1至3中均有详细步骤,在此不再描述。

任务1:求top值程序个性化(30分)

  基于ubuntukylin14.04(16)版本,完成教材141页5.4.1节求top值程序个性化。相关代码和数据参考http://dblab.xmu.edu.cn/blog/1632-2/

 1. 创建工作项目mcf14gzxm

  (1)在eclipse工作目录(本人/home/mcf14/gongzuomulu)中创建工作项目mcf14gzxm。
在这里插入图片描述
  (2)在gongzuomulu目录中输入mkdir -p mcf14gzxm/src/main/scala命令创建scala目录存放spark应用程序。
在这里插入图片描述
  (3)在gongzuomulu目录中输入vim mcf14gzxm/build.sbt命令创建包含sbt打包配置信息的build.sbt文件,并在其中添加以下信息后保存退出。

name := "Simple Project"
version := "1.0"
scalaVersion := "2.11.8"
libraryDependencies += "org.apache.spark" %% "spark-core" % "2.1.0"
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述
在这里插入图片描述
  (4)在mcf14gzxm目录中输入mkdir project命令创建project目录并进入,然后输入vim build.properties命令创建包含程序配置信息的build.properties文件并打开,在其中添加sbt的版本信息后保存退出:

sbt.version=0.13.15
  • 1

在这里插入图片描述
在这里插入图片描述

 2. 创建eclipse应用程序

  在程序主目录即/home/mcf14/gongzuomulu/mcf14gzxm中输入sbt eclipse命令创建eclipse应用程序,如下所示即为成功。
在这里插入图片描述

 3. 导入mcf14gzxm项目

  在终端输入eclipse命令打开eclipse,在eclipse界面右击左侧打开快捷菜单,然后点击import…,在Select an import wizard:中搜索Existing Projects into Workspace并选中,然后点击Next,点击Browse…找到刚才创建的工作项目mcf14gzxm(即/home/mcf14/gongzuomulu/mcf14gzxm)然后点击Finish就能导入mcf14gzxm项目了。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/568047
推荐阅读
相关标签
  

闽ICP备14008679号