赞
踩
**向孙老师致敬 ~~~ **
【ARXIV2204】Simple Baselines for Image Restoration
代码:https://github.com/megvii-research/NAFNet
论文:https://arxiv.org/abs/2204.0467
感谢知乎网友 Kester 的分享,这里用了很多他的观点
最近Transformer模型开始在图像修复领域兴起,模型的复杂度也随之上升。在这篇论文里,作者提出一个计算高效的 simple baseline 达到 SOTA 效果。
作者首先分析了当前的图像修复模型的复杂度,主要包括:inter-block 和 intra-block 。
inter-block 指的是各个模块之间的关系,包括:multi-stage, multi-scale fusion, UNet 三种结构。作者认为:宏观结构不是影响算法效果的关键(we believe the architecture will not be a barrier to performance)。为此,在本文中,作者采用了 UNet 结构,并把精力集中在到 intra-block 的改造上。
对于 intra-block 的改进,包括三方面:
作者最终提出了下面的模型,如下图中(d)所示。
从图去噪的实验结果来看,MACs 值显著降低的情况下,显著提升了效果。
最近很多工作将 Transformer 用于图像修复任务,大家都集中于研究 MHSA 是不是用于图像修复里效果会更好。但是这个论文只使用一些简单的操作就取得了非常好的效果。也让人感觉,Transformer 在图像修复任务中的成功是利益于一些 trick 的结果。
从 PlainNet 到 BaseLine,可以看出,LN 显著提升了性能。同时,GELU和CA也是有效的。
从 Baseline 到 NAFNet:作者指出 NAFNet 是 Baseline 的简单,但是性能没有下降,还有少许的提升。
Block 的数量:作者指出来,综合考虑,36比较合适。
SimpleGate 里的激活函数实验:加入激活函数以后,SIDD数据集上基本上没有影响。GoPro里面性能反而下降了。因此,作者指出 SimpleGate 里面的激活函数没有必要。
RGB图像去噪实验:作者指出客观指标和 主观效果都优于当前方法
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。