赞
踩
hadoop是一个由Apache基金会所开发的分布式系统基础架构。[1]
hadoop的框架最核心的设计就是HDFS和MapReduce,HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。[2]
hadoop具有高容错性,常部署在低廉的硬件上,而且它拥有高吞吐量,可以更好地访问应用程序中的数据,适合有着大数据集的应用程序,可以使用户在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。
DateNode节点不会对节点上的数据块的访问实施任何访问控制
继续单击页面中的“Datanodes”标签栏,可以显示出各数据节点的信息。在图中显示了组成 HDFS的3个 Datanode节点的状态与各自的存储使用情况。在HDFS中,数据是被分块进行存储的,每个数据块默认有3个副本,即每个数据节点上存储一份数据副本,因此各节点的存储用量是大致相等的。
在集群服务器的终端,输入“hdfsd”命令,按“Enter”键回车后即可看到HDFS基础操作命令的使用
帮助。
“[-mkdir [-p]<path>..]”的命令可用于创建目录,参数<path>用以指定创建的新目录。在 HDFS 中创建/user/dfstest 目录,查看在 HDFS 文件目录 /user/ 下的文件列表,可查看到新创建的目录。
- [root@master hdfs_test]# hdfs dfs -cat /user/dfstest/a.txt
- I have a pen
- I have an apple
-
- [root@master hdfs_test]# hdfs dfs -tail /user/dfstest/b.txt
- I have a pen
- I have an apple
先在 HDFS 的 /user/dfstest 目录下创建一个测试目录rmdir ,再分别删除 /user/dfstest目录下的c.txt 文件和新创建的 rmdir 目录。
在执行删除命令后,查看HDFS的 huser/dfstest目录下的内容,已成功删除 c.txt文件和mmdir 目录。
Hadoop带有用Java语言编写的框架,因此运行在 Linux 生产平台上是非常理想的。Hadoop 上的应用程序也可以使用其他语言编写,比如C++。
Hadoop 集群一般构建在通过高速网络连接的单一数据中心内,集群计算机都具有体系结构、平台一致的特点,而网格计算需要在互联网接入环境下使用,网络带宽等都没有保证。因此Hadoop可以跨大量的计算节点运行非常巨大的数据集,能大大提高效率。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。