搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
神奇cpp
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
oracle做拉链,Datastage实现拉链算法
2
ShardingSphere读写分离
3
地理信息系统教程(汤国安)——重点总结_双重独立编码结构
4
NLP发展简史_nlp的发展阶段
5
通用与垂直,谁将领跑未来?
6
推荐一款高效智能的校园考勤系统:Sistem Absensi Sekolah Berbasis QR Code
7
python3.7+dlib+face_recognition+tensorflow+keras+scipy+numpy版本(已实现)_scipy对应cpu版本
8
ARM 上的C语言开发_arm的c语言
9
【软件工程】——开发模型_软件三大开发方法表格对比
10
学习笔记Label自右向左滚动和父容器内左右移动方法(含代码)_lvgl文本从右到左滚动
当前位置:
article
> 正文
transformation和action的介绍
作者:神奇cpp | 2024-06-19 12:26:57
赞
踩
transformation的作用
Spark
支持两种RDD操作:
transformation
和
action
。
区别:
transformation操作会针对已有的RDD创建一个新的RDD;而action则主要是对RDD进行最后的操作,比如
遍历
、reduce、保存到文件等,并可以返回结果给Driver程序。
例如,map就是一种transformation操作,它用于将已有RDD的每个元素传入一个自定义的函数,并获取一个新的元素,然后将所有的新元素组成一个新的RDD。而
reduce
就是一种action操作,它用于对RDD中的所有元素进行聚合操作,并获取一个最终的结果,然后返回给Driver程序。
一、transformation的特点就是lazy特性。lazy特性指的是,如果一个spark应用中只定义了transformation操作,那么即使你执行该应用,这些操作也不会执行。也就是说,transformation是不会触发spark程序的执行的,它们只是记录了对RDD所做的操作,但是不会自发的执行。只有当transformation之后,接着执行了一个action操作,那么所有的transformation才会执行。Spark通过这种lazy特性,来进行底层的spark应用执行的优化,避免产生过多中间结果。
二、action操作执行,会触发一个spark job的运行,从而触发这个action之前所有的transformation的执行。这是action的特性。
声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
【wpsshop博客】
推荐阅读
article
uni
-
app
uni
-
swipe
-
action
滑动操作状态恢复...
首先,配置一下:show="isOpened[item.id]" @change="change(index)"注意:i...
赞
踩
article
论文笔记
Semantics
-
Guided
Neural
Networks
for
Efficien...
论文笔记
Semantics
-
Guided
Neural
Networks
for
Efficient Skeleton...
赞
踩
article
大
数据
-
计算
引擎-
Spark
(三)
:
RDD
编程
【离线分析;替代
MapReduce
编程
,
使用
RDD
(弹...
大
数据
-
计算
引擎-
Spark
:
Spark
编程
_
rdd
编程
还需要下载什么吗
rdd
编程
还需要下载什么吗 ...
赞
踩
article
大
数据
-
计算
引擎-
Spark
(三)
:
RDD
编程【离线分析;替代
MapReduce
编程,使用
RDD
(弹...
大
数据
-
计算
引擎-
Spark
:
Spark
编程_
spark
离线分析
spark
离线分析 ...
赞
踩
article
Spark
RDD
(二)
RDD
的相关行为(
Action
)
操作
_
spark
rdd支持的行动(act...
Spark
RDD
(二)
RDD
的相关行为(
Action
)
操作
Action
操作
会真正触发转换逻辑(转换
操作
参见上一篇Sp...
赞
踩
article
Spark
RDD
操作
Transformation
/
Action
以及示例_
spark
rdd
...
目录前言一、
Transformation
Pair
RDD
二、
Action
操作Pair
RDD
三、WordCount统计...
赞
踩
article
【
分布式计算
框架】
Spark
RDD
五大属性剖析 |
Action
和 Transformation...
RDD
是只读的, 不允许任何形式的修改. 虽说不能因为
RDD
和 HDFS 是只读的, 就认为分布式存储系统必须设计...
赞
踩
article
Spark
|
Spark
的
tranformer
算子
和
action
算子
整理_tranforme...
将数据集
的
元素以 Hadoop SequenceFile
的
形式写入到指定路径中,可以是本地文件系统、HDFS 或任何其...
赞
踩
article
Spark
--
RDD
两种算子:Transformation 和
Action
_.
rdd
有 tr...
Transformation(1)map(func)通过对
RDD
中每个元素执行一个function然后返回新的
RDD
/*...
赞
踩
article
Spark
的
RDD
操作
:
转换
(
transformation
)和
行动
(
action
)_
spark
对rd...
RDD
的
操作
分为两大类:
转换
(
transformation
)和
行动
(
action
)
转换
:通过
操作
将一个
RDD
转换
成另一个...
赞
踩
相关标签
uni-app
前端
javascript
微信小程序
深度学习
人工智能
神经网络
大数据
Spark
RDD
Scala
spark
RDD五大属性
Action算子
转换算子
Transformation
分布式计算框架
算子
tranformer
action
hadoop
python