赞
踩
MapReduce借鉴了函数式语言的思想,用Map和Reduce两个函数提供了高层的并行编程抽象模型。
map:对一组数据元素进行某种重复式的处理;
reduce:对Map的中间结果进行某种进一步的结果整理。
MapReduce中定义了如下的Map和Reduce两个抽象的编程接口,由用户编程去实现:
map:(k1;v1)→(k2;v2)
reduce:(k2;[v2])→(k3;v3)
通过以上两个编程接口,大家可以看出MapReduce处理数据类型是<key,value>键值对。
MapReduce虽然有很多的优势,也有相对得局限性,局限性不代表不能做,而是在有些场景下实现的效果比较差,并不适合用MapReduce来处理,主要表现在以下结果方面:
一个完整的MapReduce程序在分布式运行时有三类
先开启hadoop
start-all.sh
cd /export/server/hadoop-3.3.0/
cd /share
cd hadoop/
cd mapreduce/
hadoop jar hadoop-mapreduce-examples-3.3.0.jar pi 2 2
先开启hadoop
start-all.sh
cd /export/server/hadoop-3.3.0/
cd /share
cd hadoop/
cd mapreduce/
hadoop jar hadoop-mapreduce-examples-3.3.0.jar /input /output
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。