当前位置:   article > 正文

【Spark】(六)任务提交(Spark Submit)_spark-submit

spark-submit

Spark 任务的提交

spark-submit的一般格式如下:

bin/spark-submit [options] <app jar | python file> [app options]
  • 1

[options] 是要传给spark-submit 的标记列表。你可以运行spark-submit --help 列出所有可以接收的标记

<app jar | python File> 表示包含应用入口的JAR 包或Python 脚本。

[app options] 是传给你的应用的选项。如果你的程序要处理传给main() 方法的参数,它只会得到[app options] 对应的标记,不会得到spark-submit 的标记。

spark-submit的一些常见标记:
在这里插入图片描述

案例:WordCount(单词计数)

1、在Maven工程中创建src同级目录in,并在其目录下创建word.txt文件
word.txt文件内容如下:

hello java
hello spark
hello scala
  • 1
  • 2
  • 3

2、在Linux上/opt目录下创建kb09file文件夹,并将word.txt文件导入/opt/kb09file目录下
在这里插入图片描述
3、创建HDFS上的/data目录下文件夹kb09file,并将word.txt上传hdfs,然后为其文件夹赋权

hdfs dfs -mkdir /data/kb09file
hdfs dfs -put word.txt /data/kb09file
hdfs dfs -ls /data/kb09file
hdfs dfs -chmod -R 777 /data/kb09file
  • 1
  • 2
  • 3
  • 4

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/888109
推荐阅读
相关标签
  

闽ICP备14008679号