赞
踩
使用python的第三方库pyspark,运行时出现环境变量错误
问题如下:
Missing Python executable 'python3', defaulting to 'E:\python\Lib\site-packages\pyspark\bin\..' for SPARK_HOME environment variable. Please install Python or specify the correct Python executable in PYSPARK_DRIVER_PYTHON or PYSPARK_PYTHON environment variable to detect SPARK_HOME safely.
大概意思就是缺少SPARK_HOME
的环境变量和PYSPARK_PYTHON
的变量,需要在环境变量中配置
注意:使用pyspark算子的时候,可能会提示“找不到python解释器”的错误,那么配置PYSPARK_PYTHON
同样可以解决这个问题
SPARK_HOME=E:\python\Lib\site-packages\pyspark
PYSPARK_PYTHON=E:\python\python.exe
%SPARK_HOME%\bin…
在环境变量里面新建一个SPARK_HOME
变量,值就是你pyspark安装的地方,我安装到下面的路径了,找自己pyspark安装的路径
E:\python\Lib\site-packages\pyspark
然后在添加一个变量PYSPARK_PYTHON
,变量值填上自己的python解释器的路径,我的路径是
E:\python\python.exe
在path路径中添加SPARK_HOME
的bin
路径
重启pycharm,再次运行项目,发现成功运行成功
刚才提到,使用pyspark算子的时候,可能会报错,提示找不到python解释器,这个一般不是我们代码逻辑的问题,而需要我们做一些配置
第一种方法:
按照上面的步骤配置PYSPARK_PYTHON
到环境变量,可以解决这个问题
在pycharm中手动配置python解释器
import os
os.environ['PYSPARK_PYTHON'] = "E:/python/python.exe"
environ本质就是一个字典,添加一个键值对,就是配置python的解释器
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。