当前位置:   article > 正文

大数据技术原理及应用课实验7 :Spark初级编程实践_实验7spark初级编程实践

实验7spark初级编程实践

实验7  Spark初级编程实践

一、实验目的

1. 掌握使用Spark访问本地文件和HDFS文件的方法

2. 掌握Spark应用程序的编写、编译和运行方法

二、实验平台

1. 操作系统:Ubuntu18.04(或Ubuntu16.04);

2. Spark版本:2.4.0;

3. Hadoop版本:3.1.3。

三、实验步骤(每个步骤下均需有运行截图)

实验前期准备:

1. Spark读取文件系统的数据

(1)在spark-shell中读取Linux系统本地文件“/home/hadoop/test.txt”,然后统计出文件的行数;

(2)在spark-shell中读取HDFS系统文件“/user/hadoop/test.txt”(如果该文件不存在,请先创建),然后,统计出文件的行数;

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/592841
推荐阅读
相关标签
  

闽ICP备14008679号