赞
踩
下面的配置默认在Hadoop集群搭建成功的基础上进行搭建,如果没有搭建Hadoop,可以参考另一篇文章Hadoop完全分布式搭建
将spark的安装包下载后解压到指定目录
tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module
进入spark安装目录
cd /opt/module
将spark改名
mv spark-3.0.0-bin-hadoop3.2 spark
进入spark的conf目录
cd ./spark/conf
将slaves.template文件和spark-env.sh.template文件的后缀去掉
- mv slaves.template salves
- mv spark-env.sh.template spark-env.sh
在slaves文件中将三台服务器的名称配置上
- hadoop102
- hadoop103
- hadoop104
配置配置 spark-env.sh 文件
vim spark-env.sh
- # 配置各种软件的HOME,一般来说不配置也可以,但是可能会出现问题,还是配上
- export JAVA_HOME=/opt/module/jdk
- export SCALA_HOME=/opt/module/scala
- export HADOOP_HOME=/opt/module/hadoop
- export SPARK_HOME=/opt/module/spark
- export HADOOP_CONF_DIR=/opt/module/hadoop/etc/hadoop
- # 设置Master的IP
- export SPARK_MASTER_IP=192.168.88.102
- # 设置Master的主机名
- export SPARK_MASTER_HOST=hadoop102
- # 设置本节点的IP
- export SPARK_LOCAL_IP=192.168.88.102
- # 每一个Worker最多可以使用的内存
- export SPARK_WORKER_MEMORY=1g
- # 每一个Worker最多可以使用的cpu core的个数
- export SPARK_WORKER_CORES=1
- # 提交Application的端口,默认就是这个,万一要改呢,改这里
- export SPARK_MASTER_WEBUI_PORT=8080
- export SPARK_DIST_CLASSPATH=$(/opt/module/hadoop/etc/hadoop classpath)
配置完成后将主节点的spark分发到其他节点
- cd /opt/module
- xsync spark
在从节点中将spark中conf/spark-env.sh文件的本节点IP修改一下
- vim /opt/module/spark/conf/spark_env.sh
-
- # 修改为本节点IP地址
- export SPARK_LOCAL_IP=192.168.88.103
- export SPARK_LOCAL_IP=192.168.88.104
启动Spark集群
- cd /opt/module/spark
- sbin/start-all.sh
查看所有进程 配置成功 !
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。