赞
踩
一. 概念
1.Hadoop是【分布式系统基础架构】;主要解决海量数据的储存和分析计算。
Hadoop的logo是一个【黄色的大象】
2.Hadoop创始人【Doug Cutting】;在Lucene框架基础上进行优化升级,查询引擎和索引引擎
3.Hadoop三大发型版本:Apache 2006(最基本) Cloudera 2008 CDH
Hortonworks 2011 HDP
4.Hadoop优势(4高):
高可靠性
高拓展性
高效性
高容错性
5.Hadoop1.x Hadoop2.x Hadoop3.x 区别
Hadoop1.x组成:MapReduce(计算和资源调度)
HDFS(数据储存) Common(辅助工具)
Hadoop2.x组成:MapReduce(计算) Yarn(资源调度) HDFS(数据储存) Common(辅助工具)
Hadoop3.x组成:和Hadoop2.x组成部分相同
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。