赞
踩
Hadoop是一种分析和处理大数据的软件平台,是一种对大量数据进行分布式处理的软件框架。
HDFS和MapReduce.
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。
HDFS 的架构是基于一组特定的节点构建的,这是由它自身的特点决定的。
这些节点包括 NameNode(仅一个),它在 HDFS 内部提供元数据服务;DataNode,它为 HDFS 提供存储块。由于仅存在一个 NameNode,因此这是 HDFS 的一个缺点(单点失败)。
存储在 HDFS 中的文件被分成块,然后将这些块复制到多个计算机中(DataNode)。这与传统的 RAID 架构大不相同。块的大小(通常为 64MB)和复制的块数量在创建文件时由客户机决定。NameNode 可以控制所有文件操作。
HDFS 内部的所有通信都基于标准的 TCP/IP 协议。
MapReduce是处理大量半结构化数据集合的编程模型。
编程模型是一种处理并结构化特定问题的方式。
这是两种不同的编程模型MapReduce就是另外一种。
MapReduce和Hadoop是相互独立的,实际上又能相互配合工作得很好。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。