赞
踩
spark-submit 用户打包 Spark 应用程序并部署到 Spark 支持的集群管理气上,命令语法如下:
spark-submit [options] <python file> [app arguments]
app arguments 是传递给应用程序的参数,常用的命令行参数如下所示:
以下均是在 yarn 集群提交的任务。
1、默认设置: 会将所有日志和系统输出结果输出到 spark-submit 的 client 上
spark-submit --master yarn code1.py
code1.py
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('Test_Code1').enableHiveSupport().getOrCreate()
spark.sql("select count(*) from default.test_table").show()
2、设置 Executor 的日志级别,Executor 执行的细节(WARN 以下级别的日志)不会输出到 client 中
spark-submit --master yarn code2.py
code2.py
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('Test_Code1'
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。