赞
踩
可以节约你的时间,有更多的时间用于学习。https://m.tb.cn/h.5xZ0VZjBkIwXZje?tk=E9ciWM8TguI 。进行模块缝合,水论文,争取更快的满足毕业要求。如果需要3Dpag请标明,会给你3D的。
在实时语义分割中,现有的双分支网络结构虽然高效,但在融合高分辨率细节信息和低频上下文信息时存在局限性,即细节特征容易被周围环境信息淹没,导致过拟合现象,从而限制了现有模型分割精度的提升。作者将卷积神经网络(CNN)与比例积分微分(PID)控制器相联系,并揭示了双分支网络本质上相当于一个比例积分(PI)控制器,同样存在类似的过拟合问题。
在PIDNet这个实时语义分割网络中,Pag代表的是“Pixel-attention-guided fusion module”,中文可以译作“像素注意力导向融合模块”。该模块用于在细节分支(P branch)从包含丰富准确语义信息的I分支学习有用特征时,防止细节分支受到过多背景或全局上下文信息的压制,实现选择性地学习高层语义信息。具体来说,Pag模块通过计算P分支和I分支对应像素特征向量的点积并经过Sigmoid函数得到一个可能性值σ,表示这两个像素可能属于同一对象的程度。如果σ较高,则认为I分支提供的特征更具参考价值,反之亦然。最终输出的Pag融合结果是根据σ权重系数动态融合I分支和P分支的像素特征。这一机制借鉴了注意力机制的思想,确保在融合过程中能够更侧重于保留和利用关键的语义信息。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。