赞
踩
什么是大数据?大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。
大数据的特征可以用4个V来概括:
除此之外,大数据还有它的固有特征,即:时效性和不可变性
分布式计算的核心理念是将较大的数据分成小的部分进行处理
Hadoop是一个开源分布式系统架构,它包括了如下几个重要组成部分:
Hadoop是处理海量数据的架构首选,可以非常快得完成大数据计算任务,现已发展成为一个Hadoop生态圈
我们为什么要使用Hadoop?
HDFS优点:
HDFS缺点:
读文件:
写文件:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。