赞
踩
一.Hadoop 的优化与发展
1.1 局限与不足
1.2 改进与提升
二.HDFS2.0的新特性
2.1 HDFS HA:解决单点故障问题。
2.2 HDFS Federation
存在的问题
解决方式:HDFS Federation
三.新一代资源管理调度管家YARN
3.1 MapReduce 1.0 的缺陷
3.2 YARN 设计思路
分离出资源管理功能,单独形成YARN,MapReduce 2.0变成了运行在YARN 上的纯粹的计算框架。
YARN 是一个资源管理调度框架。
3.3 YARN 体系结构
ResourceManager:全局资源管理器,负责整个系统的资源管理与分配,两大核心组件如下;
ApplicationMaster
NodeManager
部署情况:
3.4 YARN 工作流程
3.5 YARN框架与MapReduce1.0框架的对比分析
3.6 YARN 发展目标
四.Hadoop 中代表性的组件
4.1 Pig 组件
4.2 Tez 组件
4.3 Spark 和 Kafka组件
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。