搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
盐析白兔
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
微信小程序接口请求多文件+参数上传、单文件+参数上传(formData形式) 微信小程序实现formData格式传参(亲测有效)_微信小程序 formdata
2
网络安全产品之认识蜜罐_奇安信蜜罐產品核心功能
3
跨平台移动应用开发指南:打造跨越iOS和Android的移动应用
4
nvm安装详细教程(卸载旧的nodejs,安装nvm、node、npm、cnpm、yarn及环境变量配置)_怎么把nodejs,npm,cnpm卸载干净
5
YOLOV4ToTensorRT引擎 python实现记录
6
【linux】linux工具使用
7
Vue 2.0中使用Vue-json-viewer 展示JSON格式数据_vue json格式化插件
8
MYSQL-9.问题排查
9
nginx 编译参数详解(运维不得不看)_nginx编译参数
10
非专业无人机进行倾斜摄影并且通过cesium加载_cesium加载倾斜摄影数据
当前位置:
article
> 正文
大数据技术与架构——(二)大数据处理架构Hadoop(上)_hadoop可以支持的编程语言不包括
作者:盐析白兔 | 2024-05-12 17:23:45
赞
踩
hadoop可以支持的编程语言不包括
文章目录
1.Hadoop概述
1.1Hadoop简介
1.2Hadoop发展简史
1.3Hadoop的特性
1.4Hadoop的应用现状
1.5 Apache Hadoop版本演变
1.6 Hadoop各种版本(企业开发产品)
2.Hadoop项目结构
1.Hadoop概述
1.1Hadoop简介
Hadoop是Apache [ә’pætʃi]软件基金会旗下的一个开源分布式计算平台,
为用户提供了
系统底层细节透明
的
分布式基础架构
。
Hadoop是基于Java语言开发的,具有很好的
跨平台特性
,并且可以部署在廉价的计算机集群中
Hadoop可以支持多种编程语言,如C、C++、Java、Python
Hadoop = HDFS(存)+MapReduce(算)
1.2Hadoop发展简史
创始人
Doug Cutting
Nutch 是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。
2003年,谷歌发布了分布式文件系统GFS(Google File System)
在2004年,Nutch项目也模仿GFS开发了自己的分布式文件系统NDFS(Nutch Distributed File System),也就是HDFS的前身
2004年,谷歌发布了分布式并行编程框架MapReduce
到了2006年2月,Nutch中的NDFS和MapReduce开始独立出
来,成为Lucene项目的一个子项目,称为Hadoop。
2008年1月,Hadoop正式成为Apache顶级项目。
Hadoop成名史:2008年4月,Hadoop打破世界纪录,成为最快排序
1TB数据的系统,它采用一个由910个节点构成的集群进行运算,排序时
间只用了209秒。
在2009年5月,Hadoop更是把1TB数据排序时间缩短到62秒。Hadoop
从此名声大震,迅速发展成为大数据时代最具影响力的开源分布式开发平
台,并成为事实上的大数据处理标准。
1.3Hadoop的特性
Hadoop是一个能够对大量数据进行分布式处理的软件框架,并且是以一种可靠、高效、可伸缩的方式进行处理的,它具有以下几个方面的特性:
高可靠性
多台机器构成集群,部分机器发生故障,剩余机器可以继续对外提供服务。
高效性
成百上千台机器一起计算
高可扩展性
可以不断往集群中增加机器
高容错性
当数据被发送到一个单独的节点,该数据也被复制到集群的其他节点上,这意味着故障发生时,存在另一个副本可供使用。
成本低
Hadoop通过普通廉价的机器组成服务器集群来分发以及处理数据,以至于成本很低。
运行在Linux平台上
支持多种编程语言
1.4Hadoop的应用现状
Hadoop凭借其突出的优势,已经在各个领域得到了广泛的应用,而互联网领域是其应用的主阵地.
Facebook作为全球知名的社交网站,Facebook主要将Hadoop平台用于日志处理、推荐系统和数据仓库等方面.
国内采用Hadoop的公司主要有百度、淘宝、网易、华为、中国移动等,其中,淘宝的Hadoop集群比较大
Hadoop相关应用支撑上层的3种应用
不同的Hadoop组件实现不同的企业分析
最底层HDFS满足企业中大量数据存储的需求
存储后进行分析:
离线分析对数据进行批量处理,如MR(MapReduce)也可以用数据仓库产品Hive和Pig
实时查询用Hbase数据库
数据挖掘用Mahout
1.5 Apache Hadoop版本演变
Apache Hadoop版本分为两代,我们将第一代Hadoop称为Hadoop 1.0,第二代Hadoop称为Hadoop 2.0
第一代Hadoop包含三个大版本,分别是0.20.x,0.21.x和0.22.x,其中,0.20.x最后演化成1.0.x,变成了稳定版,而0.21.x和0.22.x则增加了NameNode HA等新的重大特性
第二代Hadoop包含两个版本,分别是0.23.x和2.x,它们完全不同于Hadoop 1.0,是一套全新的架构
Hadoop 1.0两大核心
包括两部分工作=数据处理+集群的资源管理(集群CPU、内存分配)
从Hadoop 1.0到Hadoop 2.0的变化
流计算的资源调度也是YARN负责
批处理计算搭建在YARN之上,由YARN进行资源调度
1.6 Hadoop各种版本(企业开发产品)
2.
Hadoop项目
结构
声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
【wpsshop博客】
推荐阅读
article
hadoop
的
日志
详解_
namenode
hadoop
-
root
-
namenode
.
out.1
日...
本文部分资料转自本文部分资料转自本文部分资料转自。_
namenode
hadoop
-
root
-
namenode
.out...
赞
踩
article
访问
hadoop
web It
looks
like
you are
making
an HTTP ...
某日,访问
hadoop
web输入localhost:8088出现It
looks
like
you are makin...
赞
踩
article
hadoop
web界面管理错误_it
looks
like
you are
making
an h...
It
looks
like
you are
making
an HTTP
request
to a
hadoop
IPC...
赞
踩
article
It
looks
like
you are
making
an HTTP
request
to a ...
报错描述:It
looks
like
you are
making
an HTTP
request
to a Hadoo...
赞
踩
article
访问
Hadoop
2.7的namenode出现:It
looks
like
you are makin...
访问
Hadoop
2.7的namenode出现:It
looks
like
you are
making
an
HTTP
...
赞
踩
article
H
a
doop2.7报It
looks
like
you
a
re
m
a
king
a
n HTTP req...
2019独角兽企业重金招聘Python工程师标准>>> ..._it
looks
like
yo...
赞
踩
article
Linux安装
hadoop
_
pycharm
hadoop
linux
...
前提
hadoop
2.8.5wget下载
hadoop
,或如果是虚拟机,也可以使用sftp从windows上传
hadoop
文...
赞
踩
article
Hadoop
HA
高
可用
集群
详解_关于
hadoop
高
可用
集群
中
服务
的介绍...
文章目录一、
HA
概述二、HDFS-
HA
工作机制2.1 HDFS-
HA
工作要点2.2 HDFS-
HA
自动故障转移工作机制三...
赞
踩
article
Hadoop
伪
分布式
搭建
(超详细)_
hadoop
伪
分布式
localhost
...
Hadoop
伪
分布式
搭建
虚拟机准备阶段操作安全设置防火墙相关指令关闭关闭selinuxIP设置查看机器IP修改主机名修改...
赞
踩
article
Hadoop
+
Spark
大
数据
技术
(
微课版)
曾国荪
、
曹洁版
思维导图第一章
Hadoop
大
数据
开发环境...
【代码】
Hadoop
+
Spark
大
数据
技术
(
微课版)
曾国荪
、
曹洁版
思维导图第一章
Hadoop
大
数据
开发环境
(
整理复习自...
赞
踩
article
Hadoop
+
Spark
大
数据
技术(微课版)曾国荪、曹洁版思维导图第二章
HDFS
大
数据
分布式存储_...
Hadoop
+
Spark
大
数据
技术(微课版)曾国荪、曹洁版思维导图第二章
HDFS
大
数据
分布式存储_
大
数据
spark
h...
赞
踩
article
Hadoop
+
Spark
大
数据
技术
(
微课版
)
曾国荪、曹洁版思维导图
第一章
Hadoop
大
数据
开发环境...
Hadoop
概述在VirtualBox上安装虚拟机
Hadoop
安装前的准备工作。
Hadoop
+
Spark
大
数据
技术
(
微课...
赞
踩
article
进击
大
数据
系列(八)
Hadoop
通用
计算
引擎
Spark
...
点击下方名片,设为星标!回复“1024”获取2TB学习资源!前面介绍了
Hadoop
架构基石 HDFS、统一资源管理和...
赞
踩
article
Hadoop
、
Spark
等5种大
数据
框架
对比,你的项目该用哪种?...
来源:
数据
学堂编辑:谈
数据
全文共9060个字,建议阅读20分钟大
数据
是收集
、
整理
、
处理大容量
数据
集,并从中获得见解所需的...
赞
踩
article
Hadoop
+Spark+Hive_
spark
+
hive
+
hadoop
...
Hadoop
+
spark
+
hive
的知识整理_
spark
+
hive
+
hadoop
spark
+
hive
+
hadoop
...
赞
踩
article
Java
架构师之路七、大数据:
Hadoop
、
Spark
、
Hive
、
HBase
、
Kafka
等_熟悉ha...
Hive
提供了一种类SQL语言,称为
Hive
QL,以便将结构化数据映射到
Hadoop
分布式文件系统中的表中,并提供了数据...
赞
踩
article
超全面试汇总——
Hadoop
(
一
)
_
hadoop
面经...
超全面试汇总——
Hadoop
(
一
)
HDFS文件系统的特点@@HDFS的读写流程@客户端和NameNode、DataNod...
赞
踩
article
超全面试汇总——
Hadoop
(二)_
一个
文件
有
上亿
url
,
内存
有
限...
超全面试汇总——
Hadoop
(二)谈谈什么是
Hadoop
?@@MapReduce分布式计算@shuffle流程shuff...
赞
踩
article
个人笔记:
分布式
大
数据
技术原理(一)
Hadoop
框架
_
分布式
数据
处理
框架
...
Apache
Hadoop
软件库是一个
框架
,它允许使用简单的编程模型,实现跨计算机集群的大型
数据
集的
分布式
处理。它最初...
赞
踩
article
Hadoop
——大
数据
生态
体系详解_
hadoop
生态
...
这是管理队列及工作者集群的另一种方式。1)Sqoop:sqoop 是一款开源的工具,主要用于在
Hadoop
(Hive)...
赞
踩
相关标签
hadoop
大数据
mapreduce
redis
java
python
后端
spark
分布式
hive
hdfs