Linux安装、运行单机版Spark_linux运行spark3单机程序教程

作者：空白诗007 | 2024-06-28 18:11:02

踩

linux运行spark3单机程序教程

一. 安装JDK，可参考：Linux（CentOs7）安装OpenJDK1.8。

二. 安装spark。

说明：安装单机版spark只需要安装jdk和spark就可以了，因为spark内置的有scala，可不单独安装spark依赖的scala。网上说法。

2.1 到spark官网下载Spark压缩包及解压：

官网下载地址：http://spark.apache.org/downloads.html

我下载的是最新的2.3.1版本的。

下载完成后使用工具上传到Linux服务器下，然后解压压缩包、为了操作方便改名：


tar   -zxvf  spark-2.3.1-bin-hadoop2.7.tgz
mv spark-2.3.1-bin-hadoop2.7 spark-2.3.1

2.2 配置环境变量：

2.2.1 配置系统的环境变量：

进入/etc/profile目录下：vim /etc/profile，会提示文件已存在，输入“e”进入编辑模式即可，

然后在文件的最后加上如下配置：


#Spark
export SPARK_HOME=/opt/spark-2.3.1
export PATH=$PATH:$SPARK_HOME/bin

然后键盘按下“Esc”，输入“:wq”保存退出vim编辑模式，最后：source /etc/profile 使文件修改生效。

2.2.2 配置spark的配置文件：

2.2.2.1 新建spark-env.sh配置文件（spark环境配置文件）：

进入spark的conf目录下：cd /opt/spark-2.3.1/conf/，

copy一份spark-env.sh：cp spark-env.sh.template spark-env.sh

然后进入vim编辑模式：vim spark-env.sh，会提示文件已存在，输入“e”进入编辑模式即可。

在文件的最后加上如下配置：


#export SCALA_HOME=/opt/scala-2.13.0
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.181-3.b13.el7_5.x86_64  #这里是你jdk的安装路径
export SPARK_HOME=/opt/spark-2.3.1
export SPARK_MASTER_IP=XXX.XX.XX.XXX  #将这里的xxx改为自己的Linux的ip地址
#export SPARK_EXECUTOR_MEMORY=512M
#export SPARK_WORKER_MEMORY=1G
#export master=spark://XXX.XX.XX.XXX:7070