当前位置:   article > 正文

大数据Spark(五十四):扩展阅读 SparkSQL底层如何执行_spark的dag图怎么和执行计划还有sql对应起来

spark的dag图怎么和执行计划还有sql对应起来

文章目录

扩展阅读  SparkSQL底层如何执行

RDD 和 SparkSQL 运行时的区别

Catalyst


扩展阅读  SparkSQL底层如何执行

RDD 和 SparkSQL 运行时的区别

RDD 的运行流程

大致运行步骤

  • 先将 RDD 解析为由 Stage 组成的 DAG, 后将 Stage 转为 Task 直接运行

问题

  • 任务会按照代码所示运行, 依赖开发者的优化, 开发者的会在很大程度上影响运行效率

解决办法

  • 创建一个组件, 帮助开发者修改和优化代码, 但这在 RDD 上是无法实现的

为什么 RDD 无法自我

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小舞很执着/article/detail/945514
推荐阅读
相关标签
  

闽ICP备14008679号