搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
木道寻08
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
史上最全项目管理工具排行榜(包含国内外25款软件)_项目管理软件
2
Gson 、FastJson、Jackson 使用对比_jackson gson
3
第一篇博客------自我介绍_如何介绍自己的博客
4
C#梳理【事件Event】
5
Django自定义错误处理机制_django apiexception code
6
C语言 | Leetcode C语言题解之第198题打家劫舍
7
【任务调度】遗传算法求解任务调度优化问题【含Matlab源码 4542期】_遗传算法解决调度问题
8
CompletableFuture——异步编程艺术
9
大华股份轻量化AI技术斩获CVPR视觉顶会ISP赛道冠军_大华 mobile ai
10
ES是什么?看完这篇就不要再问这种低级问题了!(1)_[????-????]??es???
当前位置:
article
> 正文
Hadoop初探之Hadoop生态圈_序列在hadoop生态圈中的两个主要应用领域是永久存储和
作者:木道寻08 | 2024-08-14 09:18:23
赞
踩
序列在hadoop生态圈中的两个主要应用领域是永久存储和
一、简介
Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。
图1 Hadoop主要项目
Common:一组分布式文件系统和通用I/O的组件与接口(序列化、Java RPC和持久化数据结构)。
MapReduce:分布式数据处理模型和执行环境,运行于大型商用机集群。
HDFS:分布式文件系统,运行于大型商用机集群。
Zookeeper:一个分布式、可用性高的协调服务,提供分布式锁之类的基本服务用于构建分布式应用。
HBase:一个分布式、按列存储数据库,使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询(随机读取)。
Pig:一种数据流语言和运行环境,用以检索非常大的数据集,运行在MapReduce和HDFS的集群上。
Hive:一个分布式、按列存储的数据仓库,管理HDFS中存储的数据,并提供基于SQL的查询语言(由运行时引起翻译成MapReduce作业)用以查询数据。
Mahout:一个在Hadoop上运行的可扩展的机器学习和数据挖掘类库(例如分类和聚类算法)。
Avro:一种支持高效、跨语言的RPC以及永久存储数据的序列化系统。
Sqoop:在数据库和HDFS之间高效传输数据的工具。
二、核心
Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于BigTable,即分布式NoSQL列数据库,外加Zookeeper对应于Chubby,即分布式锁设施。
图2 Hadoop核心系统
简而言之,Hadoop提供了一个可靠的共享存储和分析系统。HDFS实现存储,而MapReduce实现分析处理。纵然Hadoop还有其它功能,但这两部分是它的核心。
三、应用
Hadoop如何应用依据具体业务而不同,可能如下图:
图3 Hadoop应用案例
四、社区
下面是一张Hadoop生态图谱,琳琅满目:
图4 Hadoop生态图谱
各大互联网公司的研究、开发和应用都直接或间接地促进Hadoop社区的发展,从而使得Hadoop生态圈更加丰富多彩。
原文:http://blog.chinaunix.net/uid-22312037-id-3969789.html
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/木道寻08/article/detail/979120
推荐阅读
article
Hadoop
之
HDFS
命令...
HDFS
(
Hadoop
Distributed File System)是
Hadoop
生态系统中的一个核心组件,它是一个...
赞
踩
article
二百四十
、
Hadoop
——
解决
Hadoop
未授权
访问
漏洞
_
hadoop
未授权
访问
漏洞
...
Hadoop
——
解决
Hadoop
未授权
访问
漏洞
_
hadoop
未授权
访问
漏洞
hadoop
未授权
访问
漏洞
...
赞
踩
article
hbase
导出数据为文本,csv,
html
等文件_
hbase
org.
apache
.
hadoop
.h...
需求:根据时间范围、区域等条件查询,将
hbase
中终端采集数据最大时间、最小时间的日志数据导出思路:1、通过
hbase
自...
赞
踩
article
hbase
系列-
hbase
导入导出_
hbase
org
.
apache
.
hadoop
.
hbase
.ma...
本文介绍了如何在HBase中进行数据操作,包括创建表、插入数据、查看数据、导出数据到HDFS以及从HDFS导入数据。通过...
赞
踩
article
HBase
备份之
ExportSnapshot
或
CopyTable
_
hbase
org.
apache
....
文章《
HBase
备份之导入导出》介绍了使用
HBase
的自带工具Export和Import来实现在主集群和从集群之间拷贝表...
赞
踩
article
hadoop
slaves
文件
_
Hadoop
完全分布式搭建步骤...
1.基础环境搭建配置网络:首先设置每台电脑的静态ip地址,然后设置好每台主机的主机名,在每台机器上都添加上所有主机的别名...
赞
踩
article
解决
HADOOP
_
HOME
and
hadoop
.
home
.
dir
are unset.异常问题_h...
我在Windows环境下 运行MapReduce程序时遇到这个异常,其原因是windows下的环境与Linux环境不同,...
赞
踩
article
Hbase
-
spring
-
boot
报错解决
java
.io.FileNotFoundException...
在
spring
-
boot
中封装使用hbase模版类进行测试的是运行出现这个问题。_
spring
boot
整合
hadoop
启...
赞
踩
article
关于IDEA出现报错:
java
.
io
.
FileNotFoundExcept
io
n
HADOOP
_H...
今天在跑wc的时候,代码仔细确认很多遍没有问题,但就是一直报错如下:Except
io
ninthread"
main
"jav...
赞
踩
article
Windows
本地
IDEA
运行
mapreduce
报错
java
.io.FileNotFoundExce...
先确保Hadoop是否安装:Apache Hadoop官网下载地址注意对应版本号配置环境变量
HADOOP
_
HOME
后cm...
赞
踩
article
Hadoop
:
HADOOP
_
HOME
and
hadoop
.
home
.dir are unset_h...
Hadoop
环境启动报错:util.Shell: Did not find winutils.exe: {}java.i...
赞
踩
article
java
.io.
FileNotFoundException
:
HADOOP
_
HOME
and had...
本文详细介绍了如何在Windows上解决调试Hadoop程序时遇到的问题。主要步骤包括下载和配置Hadoop环境,设置环...
赞
踩
article
Hadoop
本地运行MapReduce报错:
Caused
by:
java
.
io
.FileNotFo...
Hadoop
本地运行MapReduce报错:
Caused
by:
java
.
io
.FileNotFoundExcepti...
赞
踩
article
java
.io.FileNotFoundException:
HADOOP
_
HOME
and had...
java
.io.FileNotFoundException:
HADOOP
_
HOME
and
hadoop
.home.d...
赞
踩
article
Windows本地运行MapReduce报错
java
.lang.Exception: org.ap...
本文讲述了在本地开发Hadoop时遇到的
Shuffle
Error,源于core-site.xml中的
hadoop
.tmp...
赞
踩
article
Win11
上运行本地编写的
MapReduce
程序报错org.
apache
.
hadoop
.io.nat...
确保Hadoop_HOME环境变量正确配置;确保Path环境变量下有 %Hadoop_HOME%\bin确保%Hadoo...
赞
踩
article
Hadoop
Mapreduce
一些
常见问题
(
python
用户~~)
_
mapreduce
运行没输...
hadoop 使用及
常见问题
_
mapreduce
运行没
输出
mapreduce
运行没
输出
...
赞
踩
article
Hive 源码_对于filterholder(
java
.
lang
.
class
apache....
Hive_对于filterholder(
java
.
lang
.
class
)对于filterholder(
java
.
lang
...
赞
踩
article
Hadoop
:
全面
深入解析...
本文从定义、架构、原理、应用场景、常见命令、安装与配置、性能优化、安全性、未来发展和社区支持等多个方面对
Hadoop
进行...
赞
踩
相关标签
hadoop
hdfs
大数据
安全
hbase
hadoop slaves文件
hadoop配置文件
java
mapreduce
数据库
后端
intellij-idea
HADOOP_HOME and hadoop.home.dir are
Did not find winutils.exe