当前位置:   article > 正文

SimpleNet: A Simple Network for Image Anomaly Detection and Localization CVPR2023

simplenet: a simple network for image anomaly detection and localization

文章信息
题目:SimpleNet: A Simple Network for Image Anomaly Detection and Localization CVPR2023
原文:https://ieeexplore.ieee.org/document/10203746
代码:https://github.com/donaldrr/simplenet
数据集:MvTec AD

一、简述
图像异常检测和定位在工业上有大量应用。常见的图像异常检测的方法大致分为3类,即基于重构的方法(AE-SSIM, RIAD),基于合成的方法(DR-EM, CutPaste),基于嵌入的方法(CS-Flow, PaDIM, RevDist, PatchCore)。而本文提出的SimpleNet方法则是综合了合成和嵌入方法,并做了改进。SimpleNet网络由4部分构成,分别是预训练的特征提取器,浅层的特征适配器,异常特征生成器和异常判别器。本文在数据集MvTec AD上进行实验,选取基准方法(基于重构、合成、嵌入)作为对比,以FPS,AUROC作为评判标准。实验表明SimpleNet方法比以往的检测方法效果都好,且其网络构成简单,在工业上却能容易训练和应用,将学术成果转化工业应用。

二、SimpleNet模型
SimpleNet网络由4部分构成,分别是预训练的特征提取器,浅层的特征适配器,异常特征生成器和异常判别器。下图是SimpleNet网络模型图:
在这里插入图片描述

2.1处理过程:
(实线)在训练阶段,特征提取器对输入图像进行局部特征提取得到局部特征图,再使用特征适配器对局部特征图进行处理得到适配的特征图,加入高斯噪声随机得到融合异常特征图,适配特征图与融合高斯噪声的特征图进入判别器,获得2个异常得分映射。
(虚线)在测试阶段,输入一张待检测图片,经过特征提取器得到特征图,再经过特征适配器得到适配特征。将适配特征经过鉴别器得到对应的1个异常分数图。

2.2具体构成:
2.2.1 特征提取器(feature extrator)
在这里插入图片描述

2.2.2 特征适配器(feature adaptor)
在这里插入图片描述
2.2.3异常特征生成器(anomalous feature generator)
在这里插入图片描述

在这里插入图片描述
2.2.4判别器(discriminator)
在这里插入图片描述
2.2.5 损失函数
在这里插入图片描述

2.2.6异常得分
在这里插入图片描述

三、实验及结论
3.1 实验准备
数据集:MVTec AD包含5个纹理,10个类别,共计5354张图片。有用于训练的正常图像和用于测试的含赫雷缺陷的正常和异常图像,为缺陷测试图像提高像素级标准。
评价标准:I-AUROC(图像级), P-AUROC(像素级), FPS
参数设置:实验中使用的所有骨干都使用ImageNet进行了预训练。骨干网和ResNet架构相似时,使用骨干网络的第二和第三中间层用于特征提取。使用Adam优化器,将特征适配器和鉴别器的学习率分别设置为0.0001和0.0002,并将权重衰减设置为0.00001。主干网络为WideResnet50,高斯噪声设定为0,0.015), th+=th-=0.5,epoch=160,batchsize=4

3.2 实验过程
将SimpleNet方法(主干网络为WideResnet50)与现有的各类方法,如基于重构的方法(AE-SSIM, RIAD),基于合成的方法(DR-EM, CutPaste),基于嵌入的方法(CS-Flow, PaDIM, RevDist, PatchCore)一同在数据集MVTec AD上进行异常检测实验,以I-AUROC(左)和P-AUROC(右)作为评价模型好坏的标准。SimpleNet方法在15个类上有9个类都取得最高分,获得平均最好表现。实验结果见下表:
在这里插入图片描述

3.3 消融实验
p值确定:使用不同的patchsize来测试模型具体的表现,p=3时,I-AUROC和P-AUROC表现都好。p过3后,I-AUROC表现缓慢上升,P-AUROC表现下降。确定p=3。
在这里插入图片描述

网络选择:文中设计了一组实验来测试层次子集L对模型性能的影响,结果如表2所示。文中用1−3对前三个WideResNet50块进行索引。可以看出,来自层次级别3的功能已经可以实现最先进的性能,但受益于额外的层次级别2。文中选择2+3作为默认设置。
在这里插入图片描述

适配器设置:不同功能适配器的相互比较。结果表明,文中所使用的单个FC层的性能最好。直观地,特征适配器找到一个投影,使得伪造的异常特征和投影的预训练特征很容易被分割,这意味着鉴别器的简单解决方案。使用功能适配器有助于网络收敛的现象也表明了这一点.
在这里插入图片描述

主干网络选择:选取ResNet18、ResNet50、ResNet101与WideResNet50分别进行实验,WideResNet50在,I-AUROC和P-AUROC表现都好,确定主干网络为WideResNet50。
在这里插入图片描述

噪声比例:异常特征生成器中的噪声规模控制合成的异常特征与正常特征的距离。高σ导致异常特征与正常特征保持着较高的欧几里得距离。对大σ进行训练会导致决策界松散,导致高假阴性。相反,如果σ很小,训练过程将变得不稳定,并且鉴别器不能很好地推广到正常特征。下图说明了MVTec AD中每个类别的σ的影响。可以看出,σ=0.015达到了平衡,并产生了最佳性能。
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/537953
推荐阅读
相关标签
  

闽ICP备14008679号