搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
小惠珠哦
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
TCP请求如何获取客户端真实源IP地址_tcp连接怎么获取对方ip
2
(一)HDFS总体架构_hdfs的总体架构,并对每部分进行认知描述
3
springsecurity+oauth2.0 分布式认证授权-order资源服务器的配置4_enableresourceserver
4
Java程序员必备的50道Kafka面试题及解析,面试再也不怕问Kafka了_java kafka高级面试题
5
图解 MySQL 索引:B-树、B+树_mysql b+树
6
java豆瓣查书api_如何通过豆瓣API获取图书和电影列表
7
哈希(Hash)与加密(Encrypt)的基本原理、区别及工程应用_encrypt和hex
8
XSS 攻击_xss攻击代码
9
数据结构:队列的详解_数据结构队列详细讲解
10
把docker从c盘安装到d盘_docker安装到d盘
当前位置:
article
> 正文
大数据技术基础知识总结十二_大数据技术知识计算
作者:小惠珠哦 | 2024-07-31 01:58:06
赞
踩
大数据技术知识计算
批处理与流处理
批处理
就是把一整块数据切分成一小块一小块,每一个小块称为一批,把一个小块数据分配给一个计算节点进行运算,这种情况称为批处理
流处理
流处理的数据是无界的
数据就像一条河里的水源源不断地从上游流到计算框架中,我们不知道数据的总量是多少,也不知道什么时候结束
什么是 Flink
Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算
Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算
Flink 的特色
数据皆流
多平台支持
高速
Flink 的组件架构
最底层是部署相关的组件,包括了支持本地单机部署、集群部署,以及云上部署的组件。
Core 核心层,是 Flink 实现的最关键组件,包括支持分布式的流处理运算,各种分配和调度系统都在这一部分实现,为更上层的 API 提供基础服务,这也为用户的方便使用奠定了基础。
API 和 Lib 层,提供了流处理和批处理计算的各种 API,以及针对特定的计算支持库
Spark VS Flink
核心实现
Spark 主要使用 Scala 语言编写而成;
而 Flink 早期是使用 Java 进行编写的,但是后期的很多更新也使用了 Scala 语言。
编程接口
在编程接口方面,Spark 和 Flink 就更加相似了。二者都提供了对各种编程语言的支持,包括 Java、Python、Scala 等,都可以用来编写 Spark 或者 Flink 程序。
计算模型
Flink 是把所有数据都看作流来进行处理,所以它本身对流式数据有着非常优秀的计算性能,在流计算方面做了大量的优化。
Spark 虽然也是混合计算框架,但是 Spark 的设计理念是批处理,也就是所有数据都是批数据。
流批一体
Flink 会支持更加智能的流批融合,甚至是自动切换。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/小惠珠哦/article/detail/906443
推荐阅读
article
C/
C++
基础知识
...
3.signed char:有符号char(-128~127)2.unsigned char:无符号char(0~255...
赞
踩
article
InternLM
Git
基础知识
...
提交一份自我介绍。创建并提交一个项目。
InternLM
Git
基础知识
...
赞
踩
article
第
三期
书生大
模型
实战营(【入门岛】-
第
3
关 |
Git
基础知识
)...
每位参与者提交一份自我介绍。提交地址:https://github.com/InternLM/Tutorial 的 ca...
赞
踩
article
书生大模型-入门岛
3
-
Git
基础知识
...
任务内容参考:https://github.com/InternLM/Tutorial/blob/camp
3
/docs/...
赞
踩
article
【C#基础知识】——
File
(
文件
操作)
Path
类_
c#
filepath
...
Path
静态类
Path
是静态类。只适用于操作路径的类。
Path
常用的方法:1 .
Path
.Get
File
Name(st...
赞
踩
article
自然语言
处理(NLP)基础知识——
机器翻译
Metrics(
PPL
、
BLEU
、
ROUGE
)_ppl n...
自然语言
处理(NLP)基础知识——
机器翻译
Metrics(
PPL
、
BLEU
、
ROUGE
)_ppl nlpppl nlp ...
赞
踩
article
【
C++
基础
-
基础
知识
】
C++
从介绍到
HelloWorld
_
c++
helloworld
...
C++
是一门非常经典的高级编程语言。顾名思义,
C++
可以看做是C语言的增强版,在C的
基础
上扩展了更多的功能;最主要的扩...
赞
踩
相关标签
c++
开发语言
学习
git
python
人工智能
语言模型
自然语言处理
path
c#
File文件操作
机器翻译
机器学习
困惑度
BLEU
ROUGE
java
jvm