赞
踩
对于Spark来说,目前存储所有的事件信息以及UI所需要的信息都是默认存储在内存中,这在CS中,对于以Spark作为 Server的模式下,会导致OOM,也会导致造成之前作者提交PR:Multi sparkSession should share single SQLAppStatusStore的问题。
正如Better Spark UI scalability and Driver stability for large applications所说:目前的Spark UI和SHS存在如下问题:
引入以RocksDB作为存储以后,能够减少driver所需内存,并且引进新的protobuf serializer能够大大加快spark事件的读写事件
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。