当前位置:   article > 正文

深度学习《patchGAN》

patchgan

这一篇比较简单,于是也就简单学习下。

在以往的GAN学习中,判别器D网络的输出是一个标量,介于0~1之间,代表是真实图片的概率。

而patchGAN则是输出是NxN的矩阵X,每一个元素x[i][j]表示一个patch,对应于图像的一个感受野,最后取各个patch部位的均值来表示最后总的来看是真实图片的概率。

直观上理解就可以了,普通GAN输出一个数,像是一言堂,PatchGAN输出一个矩阵,最终结果求平均,考虑到图像的不同部分的影响,就像考虑了多人的建议然后给出决定。

实际上,一些研究表明对于要求高分辨率、高清细节的图像领域中,普通GAN判别器并不适合,由此引入了PatchGAN,它的感受域对于与输入中的一小块区域,也就是说,X[i][j]对应了判别器对输入图像的一小块的判别输出,这样训练使模型更能关注图像细节。
在这里插入图片描述

1.这种机制,将局部图像特征和整体图像特性相融合,这样的方法 通过每个patch 进行差别的判别, 实现了局部图像特征的提取和表征, 有利于实现更为高分辨率的图像生产;同时,对最后的 分类特征图进行平均后,也能够实现真实图片和虚假图片的相比。

2.单标量输出的更为精确的整体差异表示,相当于对整体进行加权求和平均,对于某些特征差异大的局部图像特征, 能够实现比传统的 D网络 更为合理的 损失表示。

学到了这里,发现很多GAN的设计都是可以糅合在一起,因为很多GAN都是部分结构上的设计的优化,因此可以组合起来形成更加强大的模型。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/87842
推荐阅读
相关标签
  

闽ICP备14008679号