赞
踩
NameNode用于记录整个数据的存储情况,具体的数据存储在各个Hadoop节点中,每个Hadoop的节点可以称为DataNode。假设Hadoop1到Hadoop100的机器每个都有1T的容量。那么一共就可以存储100T的数据。
Yarn 是Hadoop的资源管理器,主要管理的是CPU与内存。主要有两个模块。
MapReduce是一种编程模型。这个模型的核心步骤主要分两部分:Map(映射)和Reduce(归约)。 比如:从100T的文件当中,找到名称为“cat.mp4” 的视频。
Yarn 用于分配资源,MapReduce用于对任务进行计算。前两者操作的数据都在 HDFS 当中存储
参考:
尚硅谷Hadoop教程 : https://www.bilibili.com/video/BV1Qp4y1n7EN
知乎:https://zhuanlan.zhihu.com/p/54994736
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。