赞
踩
HDFS 文件操作有两种方式:一种是命令行方式,Hadoop 提供了一套与 Linux 文件命令类似的命令行工具;另一种是 JavaAPI,即利用 Hadoop 的 Java 库,采用编程的方式操作 HDFS 的文件。
本节将介绍 Linux 操作系统中关于 HDFS 文件操作的常用命令行,并将介绍利用 Hadoop 提供的 Java API 进行基本的文件操作,以及利用 Web 界面查看和管理 HDFS 的方法。HDFS 常用命令
在 Linux 命令行终端,可以使用命令行工具对 HDFS 进行操作。使用这些命令行可以完成 HDFS 文件的上传、下载和复制,还可以查看文件信息、格式化 NameNode 等。
HDFS 命令行的统一格式如下。hadoop fs -cmd <args>
其中,cmd
是具体的文件操作命令,<args>
是一组数目可变的参数。1. 添加文件和目录
HDFS 有一个默认工作目录 /usr/$USER,其中,$USER
是登录用户名,如 root。该目录不能自动创建,需要执行 mkdir 命令创建。hadoop fs -mkdir /usr/root
使用 Hadoop 的命令put
将本地文件 README.txt 上传到 HDFS。hadoop fs -put README.txt
注意,上面这个命令的最后一个参数是:“.”,这意味着把本地文件上传到默认的工作目录下,该命令等价于以下代码。hadoop fs -put README.txt /user/root
2. 下载文件
下载文件是指从 HDFS 中获取文件,可以使用 Hadoop 的 get 命令。例如,若本地文件没有 README.txt 文件,则需要从 HDFS 中取回,可以执行以下命令。hadoop fs -get README.txt
或者执行以下命令。hadoop fs -get README.txt /usr/root/README.txt
3. 删除文件
Hadoop 删除文件的命令为rm
。例如,要删除从本地文件上传到 HDFS 的 README.txt,可以执行以下命令。hadoop fs -rm README.txt
4. 检索文件
检索文件即查阅 HDFS 中的文件内容,可以使用 Hadoop 中的cat
命令。例如,要查阅 README.txt 的内容,可以执行以下命令。hadoop fs -cat README.txt
另外,Hadoop 的cat
命令的输出也可以使用管道传递给 UNIX 命令的 head,可以只显示文
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。