搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
秋刀鱼在做梦
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
系统架构设计高级技能 · 安全架构设计理论与实践_系统架构安全设计要求(1)_系统安全架构说明
2
毕设:基于Vue+Socket+Redis的分布式高并发防疫健康管理系统_vue redissocket
3
SpringBootWeb 篇-入门了解 Spring Cache 、Spring Task 与 WebSocket 框架_springboot的webcache
4
[大模型]Qwen2-7B-Instruct 接入 LangChain 搭建知识库助手_qwen2 langchain
5
基于FPGA的ALU计算器verilog实现_verilog实现alu
6
单项链表(数据结构)_单向链表
7
数据库-MySQL 实战项目——学校超市管理系统数据库设计与实现(附源码)_基于mysql开发的超市管理系统
8
qt5-入门-xml文件读写_qt5xml
9
未来可能会被淘汰的编程语言_r语言会被淘汰吗
10
hive insert into语句 和 insert overwrite语句_hive insert into 和 insert overwrite
当前位置:
article
> 正文
大数据学习笔记-20231124
作者:秋刀鱼在做梦 | 2024-06-24 07:30:50
赞
踩
大数据学习笔记-20231124
大
数据
基本概念
一切皆是数据,大数据主要用来解决数据的储存和计算
1. 大数据的特点
大:数据量
多:数据种类
值:价值密度
快:增长速度
信:准确度可可信度
2. 数据类型
结构化
非结构化
半结构化(有结构,但不是很多,类似于 xml)
hadoop
1. 介绍
是开发和运行大规模数据的软件平台
模块
HDFS:分布式存储框架,实现数据的海量储存
YARN:统一的资源调度平台
MAPREDUCE:实现分布式计算的框架
2. 特性
数据不容易丢失,有
副本机制
3. 机构说明
a. 元数据
解释:描述数据的数据
b. Hadoop 2.X架构
HDFS:分布式文件储存系统
namenode:hdfs的主节点,可以有多个,但是最多只有两个
管理整个HDFS集群
对元数据进行管理操作
datanode:HDFS的从节点,可以有多个
负责数据的最终储存
负责数据的读写操作
secondarynamenode:辅助节点
辅助 namenode管理元数据
当对HDFS部署高可用的时候,此时已经没有 secondary name node,取而代之的是 journalnode
辅助管理 namenode的元数据
接受 active节点的namenode传递过来的元数据信息
让 standby状态的 namenode装变为从 journal node中拉取最新的元数据信息,确保两个 namenode的元数据信息一致
YARN:分布式计算框架
resource Manager:YARN平台的主节点,可以有多个
负责接受任务
负责为一个任务在nodeManager上启动一个application master
负责资源的分配
application :只是一个进程,
对任务进行分配,并且想 resource Manager申请资源
nodeManager:YARN的从节点
负责接受 application 分配过来的任务,最终执行这些任务
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/秋刀鱼在做梦/article/detail/752036
推荐阅读
article
可能是全网最详细的
Python
安装
教程(
windows
+
iOS
)_
ios
安装
python
...
可能是全网最详细的
Python
安装
教程(
windows
+
iOS
)_
ios
安装
python
ios
安装
python
...
赞
踩
article
客户案例 | 低
代码
上的
西门子
版
ChatGPT
—
小禹
_
西门子
chat
gpt...
4个月前,
小禹
还在大禹平台上solo,4个月后,它已经活跃在
西门子
各个平台(PM,Mentor,IAM,Qlik Sen...
赞
踩
article
高性能
并行计算
华为云
实验
一:
MPI
矩阵
运算...
5.1
实验
思考1.如何添加 C、C+头文件以及库路径加入环境变量?在Linux系统中,添加C或C++头文件以及库文件到...
赞
踩
article
SQL
server
2008
R2 图文
安装
教程(附资源)_
sql
server
2008
r2 ...
安装
环境及资源系统环境:Windows 10 Enterprise 64位
SQL
版本:
sql
_
server
_
2008
_...
赞
踩
article
Android
Jetpack
组件
DataStore
的使用和简单封装,2024年最新
Android
...
其实
Android
开发的知识点就那么多,面试问来问去还是那么点东西。所以面试没有其他的诀窍,只看你对这些知识点准备的充分...
赞
踩
article
解释
docker
单机部署
kraft
模式
kafka
集群时
,
尝试各种方式
的
网络
broker
全部不通而启动...
因为单机内存不够用
,
设置了较低
的
KAFKA_HEAP_OPTS 参数值128M
,
导致
broker
通信
失败
kafka
容器...
赞
踩
article
Linux
开发讲课7
---
Linux
sysfs
文件系统
...
Sysfs通过文件和目录的方式组织信息,其中每个文件或目录对应于系统中的一个设备、驱动程序或者其他内核对象。当内核中的设...
赞
踩
article
Redis
的
安装
和
部署
教程(
Windows
环境)_
redash
安装
与
部署
windows
...
本文详细介绍了如何下载并
安装
Redis
v8.0,包括解压、修改配置文件、启动服务,以及推荐使用
Redis
DesktopM...
赞
踩
article
第七篇【传奇开心果】
beeware
的
toga
开发
移动
应用
示例
:gui工具包介绍和常用
组件
使用
方法
示例
...
这篇文章介绍了BeeWare的Toga
开发
工具,它允许Python
开发
者构建美观且功能强大的跨平台
应用
,涵盖iOS、An...
赞
踩
article
Java
集合框架详谈及代码分析(
Iterable
->
Collection
->
List
、
Set
->各...
Java
集合框架详谈及代码分析(
Iterable
->
Collection
->
List
、
Set
->各接口实现类
、
Map
-...
赞
踩
article
常用
脱壳
笔记整理
_
frida
dexdump
脱壳
...
目前有用到的
脱壳
工具:BlackDex以及大佬手动
脱壳
是真的强。
_
frida
dexdump
脱壳
frida
dexdum...
赞
踩
article
React
下同构
渲染
的
优化
手段_
react
渲染
优化
合并
...
上两篇文章:手动实现一个自己的
React
服务端
渲染
React
下的同构
渲染
本篇我会结合这两篇文章来聊聊如何
优化
Re...
赞
踩
article
github
中的
watch
、
star
、
fork
的含义...
默认每一个用户都是处于Not
watch
ing的状态,当你选择Watching,表示你以后会关注这个项目的所有动态,以后...
赞
踩
article
基于
协同
过滤
的
校内
餐厅
推荐
系统
设计与实现(源码+论文)_
基于
协同
过滤
的饮食
推荐
系统
...
随着互联网时代的不断进步,人们在日常生活中获取餐饮信息、进行消费的方式也在不断创新。相比传统餐厅,互联网餐厅得到了更快的...
赞
踩
article
机器
学习
之深度
学习
卷积
神经
网络
,实现基于
CNN
网络
的
手写字体识别_基于深度
学习
的
艺术字生成...
文章目录实现基于
CNN
网络
的
手写字体识别1、搭建
CNN
网络
模型;2、设计损失函数,选择优化函数;3、实现模型训练与测试。...
赞
踩
article
区块
链
在
供应
链
领域的应用案例...
案例一:布比物
链
构建基于
区块
链
的有品质保证且诚信公证的
供应
链
系统面对众多
供应
链
领域存
在
的问题,布比基于
区块
链
技术构建了物...
赞
踩
article
taro
跳转
客服
页面,
taro
跳转微信
客服
,
Taro
.openCustomerServiceCha...
react,
taro
跳转
客服
,微信
客服
_
taro
.opencustomerservicechat
taro
.opencus...
赞
踩
article
项目
管理成功
的
关键
:
七大关键要素_
在
项目
中非常重要
,
它往往决定了
项目
的
...
2、
项目
范围
:
项目
范围指
的
是
项目
的
边界和工作内容,明确
项目
范围有助于确保
项目
按照预期目标进行,避免范围蔓延。1、
项目
目标...
赞
踩
article
机器人
(
无人机
)
算法
解析及优化_
thet
a
st
a
r
a
st
a
r
...
机器人
(
无人机
)
算法
解析及优化_
thet
a
st
a
r
a
st
a
r
thet
a
st
a
r
a
st
a
r
...
赞
踩
article
AIGC
005-
Dreambooth
定制化
生成
,
微调
文本
到图像的扩散
模型
!_
微调
文本
生成
图片
模型
...
AIGC
005-
Dreambooth
定制化
生成
,
微调
文本
到图像的扩散
模型
!_
微调
文本
生成
图片
模型
微调
文本
生成
图片
模型
...
赞
踩
相关标签
python
windows
ios
编辑器
开发语言
百度
ide
西门子低代码
mendix
低代码
AI
ChatGPT
智能
聊天机器人
华为云
高性能并行计算
并行
高性能
MPI
串行
sql server 2008 r2
sql server
android
android jetpack
kafka