赞
踩
首先,他是Apache
软件基金会旗下的一个开源分布式计算平台,提供了底层透明的分布式基础架构(不用关心他底层是怎么实现的,编代码操作就完事了)
其次,他的开发是基于java
语言的,有很好的跨平台特性,并且可以部署在廉价的计算机集群中,我们在编程使用的时候,是不限制语言去操作的
他的核心分为两部分,分布式存储和分布式计算。其中HDFS
为海量的数据提供了如何去存储,MapReduce
为海量的数据提供了计算
最后,他是一个开源的软件
他为啥起名叫hadoop
,大佬也说了,就是他孩子为一头吃饱了的棕色大象
取得一个名字,是一个玩具名。。。
一开始,他是Apache Lucene
的创始人Doug Cutting
开发的一个文本搜索库。但是,在开发的过程中,他遇到了一个棘手的问题,该搜索引擎框架无法扩展到拥有数十亿网页的网络,就是说当数据非常大的时候,就会出现一些问题。
一年之后,2003年,谷歌公司发布了关于分布式文件系统GFS
方面的论文,可以解决大规模数据存储的问题。然后大佬就开始了,在2004年,Nuc
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。