搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
不正经
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
web3j的基础用法-5合约的调用(持续完善中...)_functionencoder.encode
2
简单易懂的Kafka安装指南:从下载到配置
3
薪资17K,在字节外包工作是一种什么体验..._字节qa外包工资
4
【ZYNQ】从入门到秃头03 Vivado软件的现代化仿真、调试工具_vivado仿真只有1000ns
5
AI绘画:利用ComfyUI进行文生图操作的完整指南
6
滴滴自动驾驶:充满“不确定性”环境下的决策和控制
7
Flink on YARN高可用集群的安装部署_flink on yam集群搭建
8
Python开源内容管理系统: Djangocms_django cms
9
SpringBoot之Undertow_springboot undertow
10
【微信小程序】如何获取用户手机号授权登录_微信小程序手机号快速登录接口怎么使用
当前位置:
article
> 正文
HDFS读写流程_hdfs的读写流程
作者:不正经 | 2024-04-20 07:36:18
赞
踩
hdfs的读写流程
HDFS
的读数据流程
1.客户端向NameNode请求读文件,NameNode通过查询元数据,找到文件块所在的DataNode地址,并返回地址给客户端
2.挑选一台DataNode(就近原则,然后随机)服务器,请求读取数据
3.DataNode开始传输数据给客户端(从磁盘里面读取数据输入流,以packet为单位校验)
4.客户端以packet为单位接收,先在本地缓存,然后写入目标文件
5.关闭资源
HDFS的写数据流程
1.首先客户端向NameNode请求上传文件
2.然后NameNode检查目录树是否可以创建文件(检查权限——是否允许上传,检查目录结构是否存在)。当都通过的时候响应客户端,反馈可以上传文件
3.客户端接收到可以上传文件的允许后,切分Block块,向NameNode请求上传第一个Block,上传到哪几个DataNode
4.NameNode进行计算,选择副本存储节点,第一个选择的是本地节点,第二个选择的是其他机架的一个节点,第三个是其他机架的另一个节点(默认三个副本存储节点)。并把这三个节点返回给客户端(dn1、dn2、dn3)
5.客户端拿到这三个节点后,创建一个流,向离的最近的一个节点(dn1)进行请求建立Block传输通道,而最近的节点(dn1)会向另外的节点(dn2)进行请求建立通道,另外的节点(dn2)会向第三个节点请求传输通道(dn3)
6.三个节点接收到请求建立通道后,逐一进行应答客户端
7.客户端开始往dn1上传第一个Block(先从磁盘读取数据放到一个本地内存缓存),以packet为单位,dn1收到一个packet后就会复制一份并传给dn2,dn2传给dn3
8.最后一个datanode成功存储之后会返回一个ack数据包,在pipeline里传递至客户端,在客户端的内部维护着"ack queue",会将返回的ack进行对比,只要有一个DataNode的ack能匹配上,就认为本次写入是成功的。
9.当一个 Block 传输完成之后,客户端再次请求 NameNode 上传第二个 Block 的服务器。(重复执行 3-7 步)
10.传输完毕之后,客户端关闭流资源,并且会告诉hdfs数据传输完毕,然后hdfs收到传输完毕就恢复元数据
DataNode写入数据失败处理流程
pipeline被关闭,在确认队列中剩下的包会被添加进数据队列的起始位置上,以至于在失败的节点下游的任何节点都不会丢失任何的包。
之后与NameNode练习后,当前在一个好的DataNode会联系NameNode,给失败节点上还未写完的块生成一个新的标识ID,以至于如果这个失败的DataNode不久后恢复了,这个不完整的块会被删除。
失败节点从pipeline中移除,之后剩下来好的DataNode会组成一个新的pipeline,剩下的这些块(刚刚放进数据队列队首的包)会继续写进pipeline中好的DataNode中。
最后,NameNode注意到备份数小于规定的备份数,它就安排在另一个节点上创建完成备份,直接从已有的块中复制就好了。直到满足了备份数。如果有多个节点写入失败了,如果满足了最小备份数的设置,写入也将成功,之后剩下的备份会被集群异步的执行备份,直到满足了备份数。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/不正经/article/detail/456149
推荐阅读
article
Hadoop
HDFS
安装
详细步骤_
hdfs
安装
...
执行完后,在当前的目录下会出现一个名为 hadoop-2.7.5 的文件目录,这个目录就是 hadoop 的
安装
目录。1...
赞
踩
article
Hadoop
HDFS
HA启动出现两个
StandBy
NameNode
...
可能是zkfc服务没有启动,正确的流程如下:1、在nn001上格式化zkfcsudo -u hdfs hdfs zkfc...
赞
踩
article
Hadoop
教程(三):
HDFS
、
MapReduce
、
程序
入门实践_图
创建
的
三种
方法
,
分别将课本样例...
Hadoop
附带了一个名为
HDFS
(
Hadoop
分布式
文件
系统)
的
分布式
文件
系统,基于
Hadoop
的
应用
程序
使用...
赞
踩
article
深入解析《企业级数据架构》:
HDFS
、
Yarn
、
Hive
、
HBase
与
Spark
的核心应用_hbas...
深入解析《企业级数据架构》:
HDFS
、
Yarn
、
Hive
、
HBase
与
Spark
的核心应用_
hbase
hive
spa...
赞
踩
article
深入解析
Hadoop
生态核心组件
:
HDFS
、
MapReduce
和
YARN
...
HDFS
默认副本数是 3,这是因为
Hadoop
有着高度的容错性,从数据冗余以及分布的角度来看,需要在同一机房不同机...
赞
踩
article
Hadoop
三大组件
HDFS
、
MapReduce
、
Yarn
_
hadoop
三大核心组件...
Hadoop
三大组件介绍
HDFS
,
MapReduce
、
Yarn
_
hadoop
三大核心组件
hadoop
三大核心组件 ...
赞
踩
article
Hadoop
三大核心组件——
HDFS
、
YARN
、
MapReduce
原理
解析_
hadoop
三大组件...
Hadoop
文章目录
Hadoop
一、 简介二、工作
原理
1.
HDFS
原理
组成介绍执行流程图2.
YARN
原理
组成介绍执行流程...
赞
踩
article
初学
Hadoop
——
HDFS
Java
API 的使用、在linux中安装
eclipse
_
hdfs
...
Hadoop
不同的文件系统之间通过调用
Java
API进行交互,实验一中介绍的Shell命令,本质上也就是
Java
AP...
赞
踩
article
hdfs
创建
用户
和
用户
组_
HDFS
两种
操作
方式:
命令行
和
Java
API
...
HDFS
文件
操作
有两种方式:一种是
命令行
方式,Hadoop 提供了一套与 Linux 文件命令类似的
命令行
工具;另一种...
赞
踩
article
常用的
Hadoop
操作_打开右侧
命令行
窗口
,
启动
hadoop
服务
,
完成下列任务: 在
hdfs
...
常用的
Hadoop
操作常用的
Hadoop
操作常用的
Hadoop
操作启动
hadoop
,在HDFS中
创建
用户
目录
“/
us
er...
赞
踩
article
Hadoop
简介(
HDFS
、
MR
、
HDFS
读写
文件
详解)
_
mr
文件
解析
...
Hadoop
2.x由
HDFS
、
MapReduce和YARN三个分支构成;
HDFS
:NN Federation
、
HAMa...
赞
踩
article
Hadoop
HDFS
:海量
数据
的
存储
解决方案
_因为
hadoop
具备海量
数据
的
存储
和
计算能力
,因此在...
作为
处理
大规模
数据
集的强大工具,
HDFS
已经成为了很多组织在大
数据
时代的基石。虽然存在一些设计和性能挑战,但其开源的本质...
赞
踩
article
HDFS
-
HA
模式概念_
hdfs
ha
...
HDFS
-
HA
模式概念什么是
HDFS
-
HA
?为什么要提出
HDFS
-
HA
机制?可能出现的问题及解决方案如何保证两台Name...
赞
踩
相关标签
hadoop
hdfs
大数据
Hadoop
教程
HDFS
MapReduce
程序入门实践
架构
hive
mapreduce
linux
hdfs 创建用户和用户组
分布式
zookeeper