赞
踩
这一篇比较简单,于是也就简单学习下。
在以往的GAN学习中,判别器D网络的输出是一个标量,介于0~1之间,代表是真实图片的概率。
而patchGAN则是输出是NxN的矩阵X,每一个元素x[i][j]表示一个patch,对应于图像的一个感受野,最后取各个patch部位的均值来表示最后总的来看是真实图片的概率。
直观上理解就可以了,普通GAN输出一个数,像是一言堂,PatchGAN输出一个矩阵,最终结果求平均,考虑到图像的不同部分的影响,就像考虑了多人的建议然后给出决定。
实际上,一些研究表明对于要求高分辨率、高清细节的图像领域中,普通GAN判别器并不适合,由此引入了PatchGAN,它的感受域对于与输入中的一小块区域,也就是说,X[i][j]对应了判别器对输入图像的一小块的判别输出,这样训练使模型更能关注图像细节。
1.这种机制,将局部图像特征和整体图像特性相融合,这样的方法 通过每个patch 进行差别的判别, 实现了局部图像特征的提取和表征, 有利于实现更为高分辨率的图像生产;同时,对最后的 分类特征图进行平均后,也能够实现真实图片和虚假图片的相比。
2.单标量输出的更为精确的整体差异表示,相当于对整体进行加权求和平均,对于某些特征差异大的局部图像特征, 能够实现比传统的 D网络 更为合理的 损失表示。
学到了这里,发现很多GAN的设计都是可以糅合在一起,因为很多GAN都是部分结构上的设计的优化,因此可以组合起来形成更加强大的模型。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。