赞
踩
CNNSpot提出了一种简单而有效的伪造图像检测器。他们采用ResNet-50作为分类器,并观察到包括JPEG压缩和高斯模糊在内的数据增强可以提高检测器的泛化能力,这意味着检测器可以很好地泛化到未见过的架构、数据集和训练方法。
GramNet观察了伪造面部和真实面部之间的纹理差异。基于这一观察,他们旨在通过将全局纹理提取融入常见的ResNet结构中,来提高检测器的泛化能力和鲁棒性。
FreDect揭示了在频率空间中,GAN生成的图像会表现出严重的伪影,这些伪影很容易被识别。基于这一分析,他们提出了伪造图像的频率异常,并从频率域进行伪造图像检测。
Fusing使用双分支模型从整个图像中提取全局空间信息,并从由新型补丁选择模块选择的多个补丁中提取局部信息特征。全局和局部特征通过多头注意力机制进行融合。然后,训练一个分类器来基于融合后的特征检测伪造图像。
LNP观察到真实图像的噪声模式在频率域中表现出相似的特征,而生成图像的噪声模式则截然不同。因此,它基于一个训练良好的去噪模型提取空间图像的噪声模式。然后,它从噪声模式的频率域中识别伪造图像。
LGrad提取了一个训练良好的图像分类器获得的梯度图,作为GAN生成图像的指纹。这种方法将数据依赖问题转化为变换模型依赖问题。然后,它基于梯度图进行二分类任务。
UnivFD使用由大型预训练视觉-语言模型(CLIP:ViT-L/14)提取的特征空间来训练检测器。大型预训练模型导致平滑的决策边界,这提高了检测器的泛化能力。
DIRE致力于识别由扩散模型生成的伪造图像。他们观察到扩散模型可以近似重建扩散生成的图像,而真实图像则不能。基于这一观察,他们利用预训练扩散模型对输入图像及其重建图像之间的误差作为指纹。
PatchCraft利用图像中丰富纹理区域和贫乏纹理区域之间的像素间相关性对比。丰富纹理区域中的像素表现出比贫乏纹理区域中的像素更显著的波动。基于这一原理,我们将图像分成多个补丁,并将它们重建为两幅图像,分别包含丰富纹理补丁和贫乏纹理补丁。随后,我们提取丰富纹理区域和贫乏纹理区域之间的像素间相关性差异特征。这一特征作为跨不同生成模型的AI生成图像取证的通用指纹。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。