当前位置:   article > 正文

大数据原理与技术(六):大数据离线计算框架MapReduce

大数据离线计算框架

MapReduce是Hadoop的核心组件之一,是一种并行编程模型,用于大规模数据集(TB级别)的并行计算。MapReduce框架将并行计算抽象成为两个函数:Map和Reduce。Hadoop MapReduce是基于HDFS的分布式编程框架,可以使没有并行计算和分布式处理系统开发经验的程序员有效利用分布式系统的丰富资源。

一、概述

1.MapReduce概述

2004年谷歌发表了关于MapReduce的论文,论文中指出MapReduce是谷歌的核心计算模型,是一种并行计算模型,它将运行在大

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/611920
推荐阅读
相关标签
  

闽ICP备14008679号