当前位置:   article > 正文

hadoop支持python吗_Hadoop:无法使用python连接到HDFS(Hadoop)

ubuntu python链接不上haoop

我正在尝试使用Windows10中的python jupyter工具连接到具有Ubuntu的VM中的HDFS。任何人都可以通过以下连接错误帮助我。谢谢。

使用的软件包:pywebhdfs ubuntu 18.0.4 Windows 10

'''

from pywebhdfs.webhdfs import PyWebHdfsClient

from pprint import pprint

HDFS_CONNECTION = PyWebHdfsClient(host='localhost',port='9000', user_name='root-sai')

HDFS_CONNECTION.list_dir('hdfs"//localhost:9000/New')

'''错误:-

ConnectionError: HTTPConnectionPool(host='localhost', port=9000): Max retries exceeded with url: /webhdfs/v1/hdfs%22//localhost%3A9000/New?op=LISTSTATUS&user.name=root-sai (Caused by NewConnectionError(': Failed to establish a new connection: [WinError 10061] No connection could be made because the target machine actively refused it'))

解决方案

webhdfs端口与RPC端口不同。默认情况下为50070。

如果未启用webhdfs(默认情况下已启用),请在hdfs-site.xml

dfs.webhdfs.enabled

true

您可以通过调用curl请求来测试是否启用了webhdfs。

测试/tmp目录是否存在,user.name根据需要更新值。

curl -i "http://localhost:50070/webhdfs/v1/tmp?user.name=hadoop-user&op=GETFILESTATUS"

初始化PyWebHdfsClient,

HDFS_CONNECTION = PyWebHdfsClient(host='localhost',port='50070', user_name='root-sai')

HDFS_CONNECTION.list_dir('/New')

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/711730
推荐阅读
相关标签
  

闽ICP备14008679号