当前位置:   article > 正文

生成对抗网络(七)----------SGAN

sgan

一、SGAN介绍

SGAN来源于这篇论文:《Semi-Supervised Learning with Generative Adversarial Networks》

传统的机器学习分为监督式学习和无监督式学习。前者的数据是有标签的,后者的数据是无标签的。然而,在很多问题中,有标签的数据是非常少的,要想获得有标签的数据,需要人工标注等一些操作。而无标签的数据则比较容易获得。半监督学习就是要结合监督式和无监督式,利用少量标签数据与大量无标签数据进行训练,然后,实现对未标签数据进行分类。

在生成对抗网络中,真实数据可以被看做有标签数据集,生成器随机产生的数据则可以被看做是无标签数据集。在DCGAN中,使用生成模型特征提取后的判别器已经可以实现分类的效果。首先,由判别器D学习到的特征可以提升分类器C的效果。那么一个好的分类器也可以优化判别器的最终效果。而C和D是无法同时训练的。然后C和D是可以相互促进提升的。而提升了判别器的能力。生成器G的效果也会随之变得更好,三者会在一个交替过程中趋向一个理想的平衡点。

因次,提出了一个半监督式GAN,称之为SGAN。希望能够同时训练生成器与半监督式分类器,最终实现一个更优的半监督式分类器,以及一个成像更高的生成模型。在传统的二分类模式基础上,SGAN变成了多分类,类型数量为N+1。分别指代N个标签和一个“假”数据。在实际过程中,判别器和分类器是一体的,记作D/C。共同与生成器G形成一个博弈关系。目标函数为负向最大似然估计(NLL)。下面为伪代码:

输入:I:总迭代次数

    for n = 1, ... , I do

          从生成器前置随机分布P_{g}(z)取出m个随机样本

          从真实数据分布p_{data}(x)取出m个真实样本

          最小化NLL,更新D/C的参数

          从生成器前置随机分布P_{g}(z)取出m个随机样本

          最大化NLL,更新G的参数

    end for 

相比较于cGAN,SGAN的生成是随机的。而且判别器的输出是一个分类器和判别器的结合。结构图如下:

二、代码实现

1. 导包

  1. rom __future__ import print_function, division
  2. from keras.datasets import mnist
  3. from keras.layers import Input, Dense, Reshape, Flatten, Dropout
  4. from keras.layers import BatchNormalization, Activation, ZeroPadding2D
  5. from keras.layers.advanced_activations import LeakyReLU
  6. from keras.layers.convolutional import UpSampling2D, Conv2D
  7. from keras.models import Sequential, Model
  8. from keras.optimizers import Adam
  9. from keras.utils import to_categorical
  10. import matplotlib.pyplot as plt
  11. import numpy as np

2. 初始化

  1. class SGAN():
  2. def __init__(self):
  3. self.img_rows = 28
  4. self.img_cols = 28
  5. self.channels = 1
  6. self.img_shape = (self.img_cols, self.img_rows, self.channels)
  7. self.num_classes = 10
  8. self.latent_dim = 100
  9. optimizer = Adam(0.0002, 0.5)
  10. # 构建判别器并编译
  11. self.discriminator = self.build_discriminator()
  12. self.discriminator.compile(loss=['binary_crossentropy', 'categorical_crossentropy'],
  13. loss_weights=[0.5, 0.5],
  14. optimizer=optimizer,
  15. metrics=['accuracy'])
  16. # 构建生成器
  17. self.generator = self.build_generator()
  18. noise = Input(shape=(100,))
  19. img = self.generator(noise)
  20. # 固定判别器
  21. self.discriminator.trainable = False
  22. # 生成器生成图像的判别结果
  23. valid, _ = self.discriminator(img)
  24. # 编译模型, 生成器和判别器的堆叠
  25. self.combined = Model(noise, valid)
  26. self.combined.compile(loss=['binary_crossentropy'],
  27. optimizer=optimizer)

3. 构建生成器

  1. def build_generator(self):
  2. model = Sequential()
  3. model.add(Dense(128 * 7 * 7, activation='relu', input_dim=self.latent_dim))
  4. model.add(Reshape((7, 7, 128)))
  5. model.add(BatchNormalization(momentum=0.8))
  6. model.add(UpSampling2D())
  7. model.add(Conv2D(128, kernel_size=3, padding='same'))
  8. model.add(Activation('relu'))
  9. model.add(BatchNormalization(momentum=0.8))
  10. model.add(UpSampling2D())
  11. model.add(Conv2D(64, kernel_size=3, padding='same'))
  12. model.add(Activation('relu'))
  13. model.add(BatchNormalization(momentum=0.8))
  14. model.add(Conv2D(1, kernel_size=3, padding='same'))
  15. model.add(Activation('tanh'))
  16. model.summary()
  17. noise = Input(shape=(self.latent_dim,))
  18. img = model(noise)
  19. return Model(noise, img)

4. 构建判别器

  1. def build_discriminator(self):
  2. model = Sequential()
  3. model.add(Conv2D(32, kernel_size=3, strides=2, input_shape=self.img_shape, padding='same'))
  4. model.add(LeakyReLU(alpha=0.2))
  5. model.add(Dropout(0.25))
  6. model.add(Conv2D(64, kernel_size=3, strides=2, padding='same'))
  7. model.add(ZeroPadding2D(padding=((0, 1), (0, 1))))
  8. model.add(LeakyReLU(alpha=0.2))
  9. model.add(Dropout(0.25))
  10. model.add(BatchNormalization(momentum=0.8))
  11. model.add(Conv2D(128, kernel_size=3, strides=2, padding='same'))
  12. model.add(LeakyReLU(alpha=0.2))
  13. model.add(Dropout(0.25))
  14. model.add(BatchNormalization(momentum=0.8))
  15. model.add(Conv2D(256, kernel_size=3, strides=1, padding='same'))
  16. model.add(LeakyReLU(alpha=0.2))
  17. model.add(Dropout(0.25))
  18. model.add(Flatten())
  19. model.summary()
  20. img = Input(shape=self.img_shape)
  21. features = model(img) # 经判别器提取的特征
  22. valid = Dense(1, activation='sigmoid')(features) # 分类器输出结果
  23. label = Dense(self.num_classes + 1, activation='softmax')(features) # 判别器结果
  24. return Model(img, [valid, label])

5. 训练模型

  1. def train(self, epochs, batch_size=128, sample_interval=50):
  2. # 加载数据
  3. (X_train, y_train), (_, _) = mnist.load_data()
  4. half_batch = batch_size / 2
  5. # 归一化到-1~~1
  6. X_train = (X_train.astype(np.float32) - 127.5) / 127.5
  7. X_train = np.expand_dims(X_train, axis=3)
  8. y_train = y_train.reshape(-1, 1)
  9. # 分类权重
  10. cw1 = {0: 1, 1: 1}
  11. cw2 = {i: self.num_classes / half_batch for i in range(self.num_classes)}
  12. cw2[self.num_classes] = 1 / half_batch
  13. # 真实值
  14. valid = np.ones((batch_size, 1))
  15. fake = np.zeros((batch_size, 1))
  16. for epoch in range(epochs):
  17. '''训练判别器'''
  18. # 选择图像批度
  19. idx = np.random.randint(0, X_train.shape[0], batch_size)
  20. imgs = X_train[idx]
  21. # 噪声样本,生成新图像
  22. noise = np.random.normal(0, 1, (batch_size, self.latent_dim))
  23. gen_imgs = self.generator.predict(noise)
  24. # 标签的one-hot变量
  25. labels = to_categorical(y_train[idx], num_classes=self.num_classes + 1)
  26. fake_labels = to_categorical(np.full((batch_size, 1), self.num_classes), num_classes=self.num_classes + 1)
  27. # 训练判别器
  28. d_loss_real = self.discriminator.train_on_batch(imgs, [valid, labels], class_weight=[cw1, cw2])
  29. d_loss_fake = self.discriminator.train_on_batch(gen_imgs, [fake, fake_labels], class_weight=[cw1, cw2])
  30. d_loss = 0.5 * np.add(d_loss_real, d_loss_fake)
  31. '''训练生成器'''
  32. g_loss = self.combined.train_on_batch(noise, valid, class_weight=[cw1, cw2])
  33. print("%d [D loss: %f, acc: %.2f%%, op_acc: %.2f%%] [G loss: %f]" % (epoch, d_loss[0], 100 * d_loss[3], 100 * d_loss[4], g_loss))
  34. if epoch % sample_interval == 0:
  35. self.sample_images(epoch)

6. 显示图像

  1. def sample_images(self, epoch):
  2. r, c = 5, 5
  3. noise = np.random.normal(0, 1, (r * c, self.latent_dim))
  4. gen_imgs = self.generator.predict(noise)
  5. gen_imgs = 0.5 * gen_imgs + 1
  6. fig, axs = plt.subplots(r, c)
  7. cnt = 0
  8. for i in range(r):
  9. for j in range(c):
  10. axs[i, j].imshow(gen_imgs[cnt, :, :, 0], cmap='gray')
  11. axs[i, j].axis('off')
  12. cnt += 1
  13. fig.savefig("images/mnist_%d.png" % epoch)
  14. plt.close()

7. 运行代码

  1. if __name__ == '__main__':
  2. sgan = SGAN()
  3. sgan.train(epochs=20000, batch_size=32, sample_interval=50)

结果:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/415179
推荐阅读
相关标签
  

闽ICP备14008679号