当前位置:   article > 正文

VGG16详细原理(含tensorflow版源码)

vgg16

VGG16原理

        VGG16是一个经典的卷积神经网络模型,由牛津大学计算机视觉组(Visual Geometry Group)提出,用于参加2014年的ImageNet图像分类比赛。VGG16的名称来源于网络中包含的16个卷积层,其基本结构如下:

  • 输入层:接收大小为224x224的RGB图像。
  • 卷积层:共13个卷积层,每个卷积层使用3x3的卷积核和ReLU激活函数,提取图像的局部特征。
  • 池化层:共5个池化层,每个池化层使用2x2的池化核和步长2,减小特征图的大小。
  • 全连接层:包含2个全连接层,每个全连接层包含4096个神经元,用于分类输出。
  • 输出层:包含一个大小为1000的全连接层,使用softmax激活函数,生成1000个类别的概率分布。

 

        VGG16的主要特点是网络结构比较深,且卷积层和池化层的数量都比较多,使得网络可以学习到更加高层次的抽象特征。此外,VGG16的卷积层都采用3x3的卷积核,这样可以保证在不增加计算量的情况下,增加了网络的深度和宽度,提高了特征提取的效率和准确性。

        在训练过程中,VGG16一般采用基于随机梯度下降(Stochastic Gradient Descent,SGD)的反向传播算法,通过最小化交叉熵损失函数来优化模型参数。在训练过程中,可以使用数据增强、正则化、dropout等技术来提高模型的泛化能力和鲁棒性。

        总的来说,VGG16是一个非常经典和有效的卷积神经网络模型,具有良好的特征提取和分类能力,可以应用于图像分类、目标检测等计算机视觉任务。

VGG16源码(tensorflow版)

  1. import tensorflow as tf
  2. from tensorflow.keras import optimizers,losses,models,datasets,Sequential
  3. from tensorflow.keras.layers import Dense,Conv2D,BatchNormalization,MaxPooling2D,Flatten
  4. class vgg16(models.Model):
  5. def __init__(self):
  6. super(vgg16, self).__init__()
  7. self.model = models.Sequential([
  8. Conv2D(filters=64,kernel_size=(3,3),padding='same',activation='relu'),
  9. Conv2D(filters=64,kernel_size=(3,3),padding='same',activation='relu'),
  10. BatchNormalization(),
  11. MaxPooling2D(),
  12. Conv2D(filters=128,kernel_size = (3,3),padding='same',activation='relu'),
  13. Conv2D(filters=128,kernel_size = (3,3),padding='same',activation='relu'),
  14. BatchNormalization(),
  15. MaxPooling2D(),
  16. Conv2D(filters=256, kernel_size=(3, 3),padding='same', activation='relu'),
  17. Conv2D(filters=256, kernel_size=(3, 3),padding='same', activation='relu'),
  18. Conv2D(filters=256, kernel_size=(3, 3),padding='same', activation='relu'),
  19. BatchNormalization(),
  20. MaxPooling2D(),
  21. Conv2D(filters=512, kernel_size=(3, 3),padding='same', activation='relu'),
  22. Conv2D(filters=512, kernel_size=(3, 3), padding='same',activation='relu'),
  23. Conv2D(filters=512, kernel_size=(3, 3), padding='same',activation='relu'),
  24. BatchNormalization(),
  25. MaxPooling2D(),
  26. Conv2D(filters=512, kernel_size=(3, 3), padding='same',activation='relu'),
  27. Conv2D(filters=512, kernel_size=(3, 3),padding='same', activation='relu'),
  28. Conv2D(filters=512, kernel_size=(3, 3), padding='same',activation='relu'),
  29. BatchNormalization(),
  30. MaxPooling2D(),
  31. Flatten(),
  32. Dense(512,activation='relu'),
  33. Dense(256,activation='relu'),
  34. Dense(10,activation='softmax')
  35. ])
  36. def call(self, x, training=None, mask=None):
  37. x = self.model(x)
  38. return x
  39. def main():
  40. (train_x,train_y),(test_x,test_y) = datasets.cifar10.load_data()
  41. train_x = train_x.reshape(-1,32,32,3) / 255.0
  42. test_x = test_x.reshape(-1,32,32,3) / 255.0
  43. model = vgg16()
  44. # model.build((None,32,32,3))
  45. # model.summary() 不使用类写VGG的话,就不报错,使用了类写VGG就报错,我也很无奈
  46. model.compile(optimizer=optimizers.Adam(0.01),
  47. loss = losses.SparseCategoricalCrossentropy(),
  48. metrics=['accuracy'])
  49. model.fit(train_x,train_y,epochs=10,batch_size=128)
  50. score = model.evaluate(test_x,test_y,batch_size=50)
  51. print('loss:',score[0])
  52. print('acc:',score[1])
  53. pass
  54. if __name__ == '__main__':
  55. main()

训练10个epoch的效果

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/496852
推荐阅读
相关标签
  

闽ICP备14008679号