当前位置:   article > 正文

spark性能调优与BUG修正_spark bug问题修复

spark bug问题修复

做了一年延云YDB的开发,这一年在使用spark上真心踩了不少坑,总结一下,希望对大家有所帮助。

spark 内存泄露

1.高并发情况下的内存泄露的具体表现

很遗憾,spark的设计架构并不是为了高并发请求而设计的,我们尝试在网络条件不好的集群下,进行100并发的查询,在压测3天后发现了内存泄露。

a)在进行大量小SQL的压测过程中发现,有大量的activejob在spark ui上一直处于pending状态,且永远不结束,如下图所示



b)并且发现driver内存爆满



c)用内存分析分析工具分析了下



2.高并发下AsynchronousListenerBus引起的WEB UI的内存泄露

短时间内 SPARK 提交大量的SQL ,而且SQL里面存在大量的 union与join的情形,会创建大量的event对象,使得这里的 event数量超过10000个event ,

一旦超过10000个event就开始丢弃 event,而这个event是用来回收 资源的,丢弃了 资源就无法回收了
。 针对UI页面的这个问题,我们将这个队列长度的限制给取消了。

 







3.AsynchronousListenerBus本身引起的内存泄露

抓包发现





 

这些event是通过post方法传递的,并写入到队列里


 

但是也是由一个单线程进行postToAll的



 

但是在高并发情况下,单线程的postToAll的速度没有post的速度快,会导致队列堆积的event越来越多,如果是持续性的高并发的SQL查询,这里就会导致内存泄露

 

接下来我们在分析下postToAll的方法里面,那个路径是最慢的,导致事件处理最慢

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/389365
推荐阅读
相关标签
  

闽ICP备14008679号