赞
踩
在HDFS系列完结之后,小伙伴们期待的MapReduce系列已经在向大家挥手了。本篇博客,小菌将为大家带来MapReduce的入门介绍!
在正式开始之前,让我们通过一张图片回顾一下Hadoop的组成部分,以及每部分的作用!
归纳:
Hadoop组成
Hadoop HDFS:一个高可靠、高吞吐量的分布式文件系统,对海量数据的存储。
Hadoop MapReduce:一个分布式的资源调度和离线并行计算框架。
Hadoop Yarn:基于HDFS,用于作业调度和集群资源管理的框架。
接下来我们正式进入到MapReduce的讲解中
是指实现某项任务或某项工作从开始到结束的计算过程或流的结构。
MapReduce具体的计算框架分布如下所示:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。