赞
踩
Hadoop由两部分组成,分别是分布式文件系统HDFS和分布式计算框架MapReduce。
在Hadoop中,MapReduce底层的分布式文件系统是独立模块,用户可按照约定的一套接口实现自己的分布式文件系统,然后经过简单的配置后,存储在该文件系统上的数据便可以被MapReduce处理。
Hadoop默认使用的分布式文件系统是HDFS(Hadoop Distributed File System)。
HDFS的架构如下图所示:
假设有一个超级大的文件10T
服务器多台 ,每一个3T
超级大的文件如何存储呢?
存储方案:将超级大的文件 切分 每一个小文件进行存储在不同的节点上
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。