当前位置:   article > 正文

IDEA远程debug之调试spark on yarn 程序(基于CDH平台)_spark on yarn 调试

spark on yarn 调试

IDEA远程DeBug连接SparkOnYarn任务

spark 远端调试

远程调试spark其实就四步:

  • 第一步jar包拷贝到集群master节点。
  • 第二步在 idea 中配置远程机器的IP 和调试端口号。
  • 第三步:启动远端的spark项目。
  • 第四步 启动idea 进行调试。
    首先
    首先了解jvm一些参数属性
-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=8787
  • 1

这里对上面的几个参数进行说明:

  • -Xdebug 启用调试特性
  • -Xrunjdwp 启用JDWP实现,包含若干子选项:
  • transport=dt_socket JPDA front-end和back-end之间的传输方法。dt_socket表示使用套接字传输。
  • address=8787 JVM在8787端口上监听请求,这个设定为一个不冲突的端口即可。
  • server=y y表示启动的JVM是被调试者。如果为n,则表示启动的JVM是调试器。
  • suspend=y y表示启动的JVM会暂停等待,直到调试器连接上才继续执行。suspend=n,则JVM不会暂停等待。

第一步 将jar包拷贝到集群

  • 将spark 项目打jar包, 将jar包放到集群master节点上;

第二步 配置idea

  • 编辑idea配置:
  • 点击小三角,选择:edit Configurations 如图
    在这里插入图片描述
    添加一个remote 配置
    在这里插入图片描述
    配置远端地址和端口 (此处配置的是 远端master 节点的地址)
    在这里插入图片描述

第三步 远端启动spark项目

  • 在集群启动要调试的spark项目。命令如下
  • spark2-submit --master yarn --deploy-mode cluster --num-executors 3 --executor-memory 3G --executor-cores 3 --driver-memory 5G --conf spark.default.parallelism=100 --conf spark.storage.memoryFraction=0.4 --conf spark.shuffle.memoryFraction=0.3 --driver-java-options "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=8787" --class com.wonders.Hbase.Data.OrderInfo --name ORDER_INFO /home/jars/test_jar/oldtestHbase/hsbp-esearch-hbase-solr-1.0-SNAPSHOT.jar "2019-01-01" "2019-03-31"
    在这里插入图片描述

第四步 启动idea
启动idea 的debug 模式就会进入断点
在这里插入图片描述如何一直不进入断点或者显示连接失败的话操作如下
通过CDH进入yarn的应用程序界面
在这里插入图片描述
然后点击进入该程序的详细信息界面,如下图就可以知道Applicationmaster在哪台NodeManager上:
在这里插入图片描述之后在IDEA中修改此任务的IP即可进入

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/757012
推荐阅读
相关标签
  

闽ICP备14008679号