当前位置:   article > 正文

什么是MapReduce(入门篇)

mapreduce

        在HDFS系列完结之后,小伙伴们期待的MapReduce系列已经在向大家挥手了。本篇博客,小菌将为大家带来MapReduce的入门介绍!

        在正式开始之前,让我们通过一张图片回顾一下Hadoop的组成部分,以及每部分的作用!
在这里插入图片描述

归纳:
Hadoop组成
 
    Hadoop  HDFS:一个高可靠、高吞吐量的分布式文件系统,对海量数据的存储。
 	Hadoop  MapReduce:一个分布式的资源调度和离线并行计算框架。
 	Hadoop  Yarn:基于HDFS,用于作业调度和集群资源管理的框架。

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

        接下来我们正式进入到MapReduce的讲解中



分布式并行计算框架MapReduce

什么是计算框架?

        是指实现某项任务或某项工作从开始到结束的计算过程或流的结构。

        MapReduce具体的计算框架分布如下所示:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/834872
推荐阅读
相关标签
  

闽ICP备14008679号