赞
踩
目前博主在实习,做大数据相关,从头开始学大数据,遂整理了一波大数据入门的工具都是什么的整理,尽量简洁说明白这些东西都是啥。
首先举例一个流程,可以辅助理解:
Hadoop是Apache开源组织的一个分布式计算开源框架(http://hadoop.apache.org/),用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。Hadoop框架中最核心设计就是:HDFS和MapReduce,HDFS实现存储,而MapReduce实现原理分析处理,这两部分是hadoop的核心。
HDFS(Hadoop Distributed File System,Hadoop分布式文件系统ÿ
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。