搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
2023面试高手
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
huaggingface模型国内网络下载_huggfaceing
2
pyqt5 python3.7教程_Python3.7安装PyQt5的方法
3
c语言仿ce内存搜索工 源代码_CE的AOB_scan功能源码内存搜索特征码
4
创建一个完整的购物商城系统是一个复杂的项目,涉及到前端、后端、数据库和支付接口等多个方面。
5
【数据结构初阶】线性表——单链表(手撕单链表)
6
AIGC - 大模型:InternLM 模型部署_ubuntu internlm
7
计算机毕业/课程设计系列基于SpringBoot+Vue的高校图书管理和座位预约系统_基于springboot、vue高校图书管理系统
8
Qt 文件操作_qt 读取单个单词
9
【毕业设计】大数据住房数据分析可视化系统 - python_租房数据分析论文
10
自动化使用 ChatGPT 生成 PPT 大纲 - 基于 Python 和 PyAutoGUI
当前位置:
article
> 正文
HDFS面试题
作者:2023面试高手 | 2024-06-05 12:37:11
赞
踩
hdfs面试题
HDFS
一、HDFS的构成
元数据
:目录结构和块的位置信息
元数据存放在内存中,默认情况下,每个文件的元数据大概有150B字节
NameNode
:负责管理元数据
DataNode
:负责存储实际数据
SecondaryNameNode
:辅助NameNode对元数据的管理
1、
NameNode
概述(了解)
是HDFS的核心,也被称为Master
仅存储HDFS的元数据:目录结构和文件的块列表及其位置信息
不存储实际数据或数据集。数据本身实际存储在DataNodes中
知道HDFS中任何给定文件的块列表及其位置。使用此信息NameNode知道如何从块中构建文件
并不持久化存储每个文件中各个块所在的DataNode的位置信息,这些信息会在系统启动时从数据节点重建
对于HDFS至关重要,当NameNode关闭时,HDFS / Hadoop集群无法访问
是Hadoop集群中的单点故障
所在机器通常会配置有大量内存(RAM)
2、DataNode概述(了解)
负责将实际数据存储在HDFS中,也被称为Slave
启动时,它将自己发布到NameNode并汇报自己负责持有的块列表
因为实际数据存储在DataNode中,所以其机器通常配置有大量的硬盘空间
会定期(dfs.heartbeat.interval配置项配置,默认是3秒)向NameNode发送心跳,如果NameNode长时间没有接受到DataNode发送的心跳, NameNode就会认为该DataNode失效(10分钟 + 30s)
block(块)汇报时间间隔取参数dfs.blockreport.intervalMsec,参数未配置的话默认为6小时
3、
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/2023面试高手/article/detail/676549
推荐阅读
article
关于
Cloudera
Hadoop
的安装(
CentOS
)- 官文标注(待完成)_centos clo...
CDH 5 and
Cloudera
Manager 5 Requirements and Supported Vers...
赞
踩
article
java
hadoop
创建
目录
结构_在
hadoop
文件系统中
创建
目录
...
我是
hadoop
的新手 . 我正在尝试在hdfs中
创建
一个
目录
,但我无法
创建
.我已登录“hduser”因此我认为/ h...
赞
踩
article
Apache Hadoop 启动报错:
master
node:
ssh
:
conne
ct
to
host
...
最近在 Win10 系统上配置了ubuntu-18.04.3,在配置集群的
ssh
无密钥登录时,经常能碰到
ssh
: ...
赞
踩
article
hadoop
问题:ssh:
connect
to
host
hadoop
port
22: Conn...
绝大部分原因是ip地址没有设置好。1.查看防火墙是不是关闭:systemctl status firewalld永久关闭...
赞
踩
article
搭建一个
Hadoop
集群
HDFS
-
HA
(
Zookeeper
自动
故障
转移)...
前言之前已经搭建过一个hadoop
集群
(搭建方法),在这个
集群
的基础上进行改进,引用
Zookeeper
来进行自动
故障
转移...
赞
踩
article
Hadoop
(03)
Hadoop
集群环境下
DataNode
无法连接
NameNode
问题_hadoo...
datanode错误日志:WARN org.apache.
hadoop
.hdfs.server.datanode.Dat...
赞
踩
article
HDFS
RPC
响应
调优:
FairCallQueue
调优...
默认的优先级阈值为(0.125、0.25、0.5),即呼叫占总呼叫数50%以上(最多只能有一个)的用户优先级最低,占总呼...
赞
踩
article
Hadoop 实战 |
词频
统计
WordCount
_
hadoop
词频
统计
...
该程序基于Hadoop MapReduce框架实现了简单的单词计数功能,适用于大规模文本数据的并行处理。WordCoun...
赞
踩
article
spark
读取h
dfs
文件的速度 耗时_
spark
.
hadoop
.
dfs
.
client
.reads...
spark
_
spark
.
hadoop
.
dfs
.
client
.
readslow
spark
.
hadoop
.
dfs
.clien...
赞
踩
article
Spark
数据读写--
HDFS
、
HBase
、Json_
spark
java读取
hdfs
文件写hbas...
1. 共享变量2. 数据读写2.1 本地文件的读写读文件import org.apache.
spark
.sql.Spar...
赞
踩
article
spark
读取
hdfs
路径下
的
数据
_
spark
读取
hdfs
数据
分区规则...
下文以
读取
parquet 文件 / parquet hive table 为例:hive metastore 和 pa...
赞
踩
article
跟天齐老师学
Spark
(4)--
Spark
整合
hdfs
_
spark
连接
hdfs
高可用
集群
cor...
spark
整合
hdfs
:需求:从
hdfs
中读取数据,用
spark
计算,再写到
hdfs
中。启动zookeeper;启动ha...
赞
踩
article
【
Hadoop
---
10
】
MapReduce
:
map
阶段与
reduce
阶段「用一个
统计
词频的案例体会...
1.
Hadoop
的类型与Java类型的映射2. 基于
Hadoop
使用Java实现词频
统计
第一步:确定 Map、Redu...
赞
踩
article
Hadoop
3.x 启动失败_
starting
namenodes
on
[
master
] err...
Hadoop
启动失败_
starting
namenodes
on
[
master
]
error
: attempting...
赞
踩
article
启动
hadoop
集群时报错
ERROR
: Attempting to
operate
on
hdfs
...
启动
hadoop
时报错:[
root
@
hadoop
101 ~]# /opt/module/
hadoop
/
hadoop
-3....
赞
踩
article
hadoop
HA (
no
zkfc
to
s
to
p
) DFSZKFailoverControlle...
这个bug确实恶心的不要不要的。我一开始以为是我自己打开方式(毕竟不熟悉搭建流程,别人怎么做,我照着做)我照着视频或者博...
赞
踩
article
Hadoop 之
Anolis
8.6 下
MySQL
8.0.33
安装
(七)_
anolisos
安...
Anolis
下
MySQL
安装
1.RPM包
安装
2.源码
安装
(耗时)_
anolisos
安装
mysql
anolisos
安...
赞
踩
article
Hadoop
安装教程 (Mac m1/m2版)_
mac
m1 安装
hadoop
是
yarn
-si...
中内容替换如下,路径需换成自己的路径。(4)打开core-
site
.sh文件【vim core-
site
.
xml
】,将标...
赞
踩
article
【
hadoop
】
hbase
的
安装
部署以及相关操作(图文详解)
_
hbase
安装
_
hadoop
+hbas...
因为HBase依赖于Hadoop
的
分布式文件系统HDFS和资源管理框架YARN,而且HBase
的
各个版本都会对Hadoo...
赞
踩
article
Hadoop
系列 - 初识
Hadoop
及
NameNode
解析
_
hadoop
namenod...
NameNode
作为集群的 Master 节点,需要管理集群中的所有 Slave 节点即 DataNode,负责 Da...
赞
踩
相关标签
hadoop
cloudera
安装
java hadoop 创建目录结构
Hadoop启动报错
连接主机端口超时
主机端口超时
masternode连接超时
ssh连接超时
白鹿第一帅
ssh异常
大数据
分布式
java
big data
spark
hdfs
spark读取hdfs路径下的数据