赞
踩
hadoop三大组件:
1、HDFS一个高可靠、高吞吐量的分布式文件系统存储海量数据分布式安全性副本数据数据是以block的方式进行存储的,128M比如:200M—128M 72M
2、MapReduce一个分布式的离线并行计算框架对海量数据的处理分布式思想:分而治之大数据集分为小的数据集每个数据集进行逻辑业务处理(map)合并统计数据结果(reduce)
3、Yarn分布式资源管理框架管理整个集群的资源(内存、CPU核数)分配调度集群的资源
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。