赞
踩
训练的关键在于,我们希望奖励哪些行为,惩罚哪些行为。这也正是损失函数的作用。
········如果图像通过了鉴别器的检验,我们奖励生成器。
········如果伪造的图像被识破,我们惩罚生成器。
我们不希望先用所有的数据训练其中的任何一方,在训练另一方。
我们希望他们能够一起学习,任何一方都不应该超过另一方太多。
如果鉴别器进步来的太快,生成器可能永远也追不上。
如果鉴别器的学习速度太慢,生成器则会因为不断生成质量差较差的数据而受到奖励。
第一步:向鉴别器展示一个真实的数据样本,告诉它该样本的分类应该是1.0。
——————然后用损失来更新鉴别器。
第二步:向鉴别器展示一个生成器的输出,告诉它该样本的分类应该是0.0。
——————我们只用损失来更新鉴别器。注意,不要更新生成器!!!!
——————我们不希望它因为被鉴别器识破而收到奖励。
第三步:向鉴别器显示一个生成器的输出,告诉生成器结果应该是1.0。
——————我们只用结果的损失来更新生成器,而不更新鉴别器。
——————因为我们不希望因为错误分类而奖励生成器。
这就是大多数GAN训练方案的核心。
``
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。