赞
踩
大数据:指无法在一定的时间范围内用常规的软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
主要解决,海量数据的存储和海量数据的分析计算问题。
按顺序给出数据存储单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
大数据的特点简称 4V 特征:
Hadoop是一个由Apache基金会所开发的分布式系统基础架构,主要解决海量数据的存储和海量数据的分析计算问题。从广义来说,Hadoop通常指的是一个更广泛的概念——Hadoop生态圈。
Google是Hadoop的思想之源,(Google在大数据方面的三篇论文)
Hadoop的优势
注意:模块间联系越多,其耦合性越强,同时表明其独立性越差
Hadoop Distributed File System,简称 HDFS,是一个分布式文件系统。
HDFS架构:
MapReduce将计算过程分为两个阶段:Map和Reduce
图中涉及的技术名词解释如下:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。