赞
踩
目录
Hadoop Distributed File System (HDFS) 是一个分布式文件系统,用于存储和处理大规模数据集。HDFS具有高可扩展性、高容错性和高吞吐量的特点,是Apache Hadoop框架的核心组件之一。
HDFS提供了一个命令行界面(Shell),用于管理和操作文件系统中的文件和目录。使用HDFS的Shell,用户可以执行各种文件系统操作,如创建目录、上传文件、下载文件、删除文件等。
HDFS的Shell操作类似于Linux的命令行操作,用户可以使用一系列命令来完成各种操作。Shell命令包括一些基本的文件系统操作命令,如ls(列出文件和目录)、mkdir(创建目录)、put(上传文件)、get(下载文件)、rm(删除文件)等。此外,HDFS的Shell还提供了一些其他有用的命令,如chown(修改文件所有者)、chgrp(修改文件所属组)、chmod(修改文件权限)等。
用户可以通过在终端中输入hdfs命令来启动HDFS的Shell。在Shell中,用户可以使用上述命令来管理和操作HDFS文件系统中的文件和目录。通过简单的命令,用户可以轻松地完成HDFS文件系统的常见操作。
HDFS的Shell操作简单方便,适用于对文件进行基本的管理和操作。对于更复杂的操作,如数据分析和处理,用户通常会使用其他工具,如Hadoop MapReduce或Spark等。但对于一些简单的文件系统操作,HDFS的Shell是十分有用的。
由于在前置设置中已经配置好了环境,所以只需要执行红色代码即可。
关于HDFS文件系统的操作命令,Hadoop提供了2套命令体系
path为待创建的目录
-p选项的行为与Linux mkdir -p一致,它会沿着路径创建父目录
-h人性化显示文件size
-R递归查看指定目录及其子目录
可以查看到我们之前所创建的文件夹。
-f 覆盖目标文件(已存在下)
-p 保留访问和修改时间,所有权和权限
localsrc 本地文件系统(客户端所在机器)
dst 目标文件系统(HDFS)
读取指定文件全部内容,显示在标准输出控制台。
读取大文件可以使用管道符配合more
下载文件到本地文件系统指定目录,localdst必须是目录
-f 覆盖目标文件(已存在下)
-p 保留访问和修改时间,所有权和权限
将文件test.txt复制到/home目录下。
将所有给定本地文件的内容追加到给定dst文件。
dst如果文件不存在,将创建该文件。
如果<localSrc>为-,则输入为从标准输入中读取。
移动文件到指定文件夹下
可以使用该命令移动数据,重命名文件的名称。
删除指定路径的文件或文件夹
-skipTrash 跳过回收站,直接删除。
- <property>
- <name>fs.trash.interval</name>
- <value>1440</value>
- </property>
- <property>
- <name>fs.trash.checkpoint.interval</name>
- <value>120</value>
- </property>
除了使用命令操作HDFS文件系统外,在HDFS的WEB UI 上也可以查看到HDFS系统的内容。
http://node1:9870
使用WEB浏览操作文件系统,一般会遇到权限问题
这是因为WEB浏览器中是以用户(dr,who)登录的,其只有只读权限,多数操作是做不了的。如果需要以特权用户在浏览器中进行操作,需要配置core-site.xml并重启集群,但是,不推荐这样做。
在HDFS中,可以使用和Linux一样的授权语句,即chown和chmod
root:用户 supergroup:组
hadoop fs -chown [-R] root:supergroup /xxx.txt
hdfs dfs -chown [-R] root:root /xxx.txt
hadoop fs -chown [-R] 777 /xxx.txt
hdfs dfs -chown [-R] 777 /xxx.txt
在jetbrains的产品中,均可以安装插件,其中:Big Data Tools插件可以帮助我们方便的操作HDFS,比如:
均可以支持Bigdata Tools插件
设置-> plugins(插件)-> Marketplace(市场),搜索Big Data Tools
需要对Windows系统做一些基础设置,配合插件使用
打开插件
点击
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。