当前位置:   article > 正文

Linux虚拟机环境搭建spark_linux spark安装

linux spark安装

Linux环境搭建Spark分为两个版本,分别是Scala版本和Python版本。

一、 安装Pyspark

环境以 Python 环境为例。

1、下载spark

下载网址:https://archive.apache.org/dist/spark

下载安装包:根据自己环境选择合适版本,本环境以spark3.0版本为案例。

  1. 根据hadoop版本下载下载 spark-3.0.0-bin-hadoop2.7.tgz  / spark-3.0.0-bin-hadoop3.2.tgz
  2. 如果不依赖hadoop,则下载spark-3.0.0-bin-without-hadoop.tgz
  3. 只安装pyspark下载pyspark-3.0.0.tar.gz

个人推荐带有hadoop版本 如 spark-3.0.0-bin-hadoop3.2.tgz ,将来可以使用hadoop,也可以使用python环境。

2、上传spark安装包到目录

3、解压spark安装包并重命名

重命名主要是为了便于配置环境变量

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/766862
推荐阅读
相关标签
  

闽ICP备14008679号