当前位置:   article > 正文

spark集群配置安装_spark完全分布式集群的安装部署 spark-3.2.1-bin-hadoop2.7.tgz

spark完全分布式集群的安装部署 spark-3.2.1-bin-hadoop2.7.tgz

1.下载spark-3.2.1-bin-hadoop2.7.tgz

2.准备3台服务器,在三台服务器的hosts文件里配置主机名和ip的对应关系,例如:

192.168.100.41  node1
192.168.100.171  node2
192.168.100.232  node3

3.安装jdk并配置环境变量,假设jdk安装路径为/usr/local/jdk

4.关闭防火墙

5.上传spark包到三个服务器的相同文件夹下,解压

6.将conf文件夹下的spark-env.sh.template和workers.template分别命名为spark-env.sh和workers

7.node1作为master,修改三台服务器的spark-env.sh,在文件的最下面添加

   export JAVA_HOME=/usr/local/jdk
   export SPARK_MASTER_HOST=node1
   export SPARK_MASTER_PORT=7077
   export SPARK_LOCAL_IP=本机IP

8.在workers配置文件中配置三台主机的名称

node1

node2

node3

9.配置node1到node2和node3的ssh免密登陆,关闭防火墙

10.在node1上进入到spark的sbin目录下,执行./start-all.sh

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/526904
推荐阅读
相关标签
  

闽ICP备14008679号