当前位置:   article > 正文

Spark完全分布式搭建_spark完全分布式环境搭建

spark完全分布式环境搭建

下面的配置默认在Hadoop集群搭建成功的基础上进行搭建,如果没有搭建Hadoop,可以参考另一篇文章Hadoop完全分布式搭建

spark的安装包下载后解压到指定目录

tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module

进入spark安装目录

cd /opt/module

将spark改名

mv spark-3.0.0-bin-hadoop3.2 spark

进入spark的conf目录

cd ./spark/conf

将slaves.template文件和spark-env.sh.template文件的后缀去掉

  1. mv slaves.template salves
  2. mv spark-env.sh.template spark-env.sh

在slaves文件中将三台服务器的名称配置上

  1. hadoop102
  2. hadoop103
  3. hadoop104

配置配置 spark-env.sh 文件

vim spark-env.sh
  1. # 配置各种软件的HOME,一般来说不配置也可以,但是可能会出现问题,还是配上
  2. export JAVA_HOME=/opt/module/jdk
  3. export SCALA_HOME=/opt/module/scala
  4. export HADOOP_HOME=/opt/module/hadoop
  5. export SPARK_HOME=/opt/module/spark
  6. export HADOOP_CONF_DIR=/opt/module/hadoop/etc/hadoop
  7. # 设置Master的IP
  8. export SPARK_MASTER_IP=192.168.88.102
  9. # 设置Master的主机名
  10. export SPARK_MASTER_HOST=hadoop102
  11. # 设置本节点的IP
  12. export SPARK_LOCAL_IP=192.168.88.102
  13. # 每一个Worker最多可以使用的内存
  14. export SPARK_WORKER_MEMORY=1g
  15. # 每一个Worker最多可以使用的cpu core的个数
  16. export SPARK_WORKER_CORES=1
  17. # 提交Application的端口,默认就是这个,万一要改呢,改这里
  18. export SPARK_MASTER_WEBUI_PORT=8080
  19. export SPARK_DIST_CLASSPATH=$(/opt/module/hadoop/etc/hadoop classpath)

配置完成后将主节点的spark分发到其他节点

  1. cd /opt/module
  2. xsync spark

在从节点中将spark中conf/spark-env.sh文件的本节点IP修改一下

  1. vim /opt/module/spark/conf/spark_env.sh
  2. # 修改为本节点IP地址
  3. export SPARK_LOCAL_IP=192.168.88.103
  4. export SPARK_LOCAL_IP=192.168.88.104

启动Spark集群

  1. cd /opt/module/spark
  2. sbin/start-all.sh

查看所有进程 配置成功 !

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/526888
推荐阅读
相关标签
  

闽ICP备14008679号