当前位置:   article > 正文

CNN提取图片特征,之后用SVM分类_cnn-svm图像分类

cnn-svm图像分类

先用CNN提取特征,之后用SVM分类,平台是TensorFlow 1.3.0-rc0,python3.6 

这个是我的一个小小的测试,下面这个链接是我主要参考的,在实现过程中,本来想使用vgg16或者VGG19做迁移来提取特征,但是担心自己的算力不够,还有就是UCI手写数据集本来就是一个不大的数据集,使用vgg16vgg19有点杀鸡用牛刀的感觉。于是放弃做迁移。

我的代码主要是基于下面链接来的。参考链接点击打开链接

这个代码主要是,通过一个CNN网络,在网络的第一个全连接层也就h_fc1得到的一个一维的256的一个特征向量,将这个特征向量作为的svm的输入。主要的操作是在代码行的140-146.    同时代码也实现了CNN的过程(读一下代码就知道)。

如果你要是知道你的CNN的结构,然后就知道在全连接层输出的其实就是一个特征向量。直接用这个特征向量简单处理输入到svm中就可以。

具体的参考论文和代码数据集等,百度网盘

CNN卷积层简介

CNN,有两个卷积(5*5)池化层(2*2maxPooling),然后两个全连接层h_fc1和h_fc2,我只使用第一个全连接层h_fc1就提取了特征。

然后中间的激活函数使用的是relu函数,同时为了防止过拟合使用了dropout的技巧。然后这个代码中其实是实现了完整的CNN的的预测的,损失使用交叉熵,优化器使用了AdamOptimizer

图片大小的变化:


最后从全连接层提取的256维的向量。输入svm。

SVM分类

SVM采用的是RBF核(高斯核),C0.9

也可以尝试线性核,我试了一下效果差不多,但是没有高斯核分类效率好。

流程和实验设计

流程:整理训练网络的数据,对样本进行处理 -> 建立卷积神经网络-> 将数据代入进行训练 -> 保存训练好的模型(从全连接层提取特征) -> 把数据代入模型获得特征向量 -> 用特征向量代替原本的输入送入SVM训练 -> 测试时同样将h_fc1转换为特征向量之后用SVM预测,获得结果。

使用留出法样本处理和评价:

1.将原样本随机地分为两半。一份为训练集,一份为测试集

2.重复1过程十次,得到十个训练集和十个对应的测试集

3.取十份训练集中的一份和其对应的测试集。代入到CNN和SVM中训练。

4.依次取训练集和测试集,则可完成十次第一步。

5.将十次的表现综合评价,十次验证取平均值,计算正确率、准确率、召回率、F1值。比如 F1 分数 , 用于测量不均衡数据的精度. 


  1. # coding=utf8
  2. import random
  3. import numpy as np
  4. import tensorflow as tf
  5. from sklearn import svm
  6. from sklearn import preprocessing
  7. import time
  8. start = time.clock()
  9. right0 = 0.0  # 记录预测为1且实际为1的结果数
  10. error0 = 0  # 记录预测为1但实际为0的结果数
  11. right1 = 0.0  # 记录预测为0且实际为0的结果数
  12. error1 = 0  # 记录预测为0但实际为1的结果数
  13. for file_num in range(10):
  14.     # 在十个随机生成的不相干数据集上进行测试,将结果综合
  15.     print('testing NO.%d dataset.......' % file_num)
  16.     ff = open('digit_train_' + file_num.__str__() + '.data')
  17.     rr = ff.readlines()
  18.     x_test2 = []
  19.     y_test2 = []
  20.     
  21.     for i in range(len(rr)):
  22.         x_test2.append(list(map(int, map(float, rr[i].split(' ')[:256]))))
  23.         y_test2.append(list(map(int, rr[i].split(' ')[256:266])))
  24.     ff.close()
  25.     # 以上是读出训练数据
  26.     ff2 = open('digit_test_' + file_num.__str__() + '.data')
  27.     rr2 = ff2.readlines()
  28.     x_test3 = []
  29.     y_test3 = []
  30.     for i in range(len(rr2)):
  31.         x_test3.append(list(map(int, map(float, rr2[i].split(' ')[:256]))))
  32.         y_test3.append(list(map(int, rr2[i].split(' ')[256:266])))
  33.     ff2.close()
  34.     # 以上是读出测试数据
  35.     sess = tf.InteractiveSession()
  36.     # 建立一个tensorflow的会话
  37.     # 初始化权值向量
  38.     def weight_variable(shape):
  39.         initial = tf.truncated_normal(shape, stddev=0.1)
  40.         return tf.Variable(initial)
  41.     # 初始化偏置向量
  42.     def bias_variable(shape):
  43.         initial = tf.constant(0.1, shape=shape)
  44.         return tf.Variable(initial)
  45.     # 二维卷积运算,步长为1,输出大小不变
  46.     def conv2d(x, W):
  47.         return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')
  48.     # 池化运算,将卷积特征缩小为1/2
  49.     def max_pool_2x2(x):
  50.         return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
  51.     # 给x,y留出占位符,以便未来填充数据
  52.     x = tf.placeholder("float", [None, 256])
  53.     y_ = tf.placeholder("float", [None, 10])
  54.     # 设置输入层的W和b
  55.     W = tf.Variable(tf.zeros([256, 10]))
  56.     b = tf.Variable(tf.zeros([10]))
  57.     # 计算输出,采用的函数是softmax(输入的时候是one hot编码)
  58.     y = tf.nn.softmax(tf.matmul(x, W) + b)
  59.     # 第一个卷积层,5x5的卷积核,输出向量是32维
  60.     w_conv1 = weight_variable([5, 5, 1, 32])
  61.     b_conv1 = bias_variable([32])
  62.     x_image = tf.reshape(x, [-1, 16, 16, 1])
  63.     # 图片大小是16*16,,-1代表其他维数自适应
  64.     h_conv1 = tf.nn.relu(conv2d(x_image, w_conv1) + b_conv1)
  65.     h_pool1 = max_pool_2x2(h_conv1)
  66.     # 采用的最大池化,因为都是1和0,平均池化没有什么意义
  67.     # 第二层卷积层,输入向量是32维,输出64维,还是5x5的卷积核
  68.     w_conv2 = weight_variable([5, 5, 32, 64])
  69.     b_conv2 = bias_variable([64])
  70.     h_conv2 = tf.nn.relu(conv2d(h_pool1, w_conv2) + b_conv2)
  71.     h_pool2 = max_pool_2x2(h_conv2)
  72.     # 全连接层的w和b
  73.     w_fc1 = weight_variable([4 * 4 * 64, 256])
  74.     b_fc1 = bias_variable([256])
  75.     # 此时输出的维数是256维
  76.     h_pool2_flat = tf.reshape(h_pool2, [-1, 4 * 4 * 64])
  77.     h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, w_fc1) + b_fc1)
  78.     # h_fc1是提取出的256维特征,很关键。后面就是用这个输入到SVM中
  79.     # 设置dropout,否则很容易过拟合
  80.     keep_prob = tf.placeholder("float")
  81.     h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)
  82.     # 输出层,在本实验中只利用它的输出反向训练CNN,至于其具体数值我不关心
  83.     w_fc2 = weight_variable([256, 10])
  84.     b_fc2 = bias_variable([10])
  85.     y_conv = tf.nn.softmax(tf.matmul(h_fc1_drop, w_fc2) + b_fc2)
  86.     cross_entropy = -tf.reduce_sum(y_ * tf.log(y_conv))
  87.     # 设置误差代价以交叉熵的形式
  88.     train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
  89.     # 用adma的优化算法优化目标函数
  90.     correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
  91.     accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
  92.     sess.run(tf.global_variables_initializer())
  93.     for i in range(3000):
  94.         # 跑3000轮迭代,每次随机从训练样本中抽出50个进行训练
  95.         batch = ([], [])
  96.         p = random.sample(range(795), 50)
  97.         for k in p:
  98.             batch[0].append(x_test2[k])
  99.             batch[1].append(y_test2[k])
  100.         if i % 100 == 0:
  101.             train_accuracy = accuracy.eval(feed_dict={x: batch[0], y_: batch[1], keep_prob: 1.0})
  102.             # print "step %d, train accuracy %g" % (i, train_accuracy)
  103.         train_step.run(feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.6})
  104.         # 设置dropout的参数为0.6,测试得到,大点收敛的慢,小点立刻出现过拟合
  105.     print("test accuracy %g" % accuracy.eval(feed_dict={x: x_test3, y_: y_test3, keep_prob: 1.0}))
  106.     # def my_test(input_x):
  107.     #     y = tf.nn.softmax(tf.matmul(sess.run(x), W) + b)
  108.     
  109.     for h in range(len(y_test2)):
  110.         if np.argmax(y_test2[h]) == 7:
  111.             y_test2[h] = 1
  112.         else:
  113.             y_test2[h] = 0
  114.     for h in range(len(y_test3)):
  115.         if np.argmax(y_test3[h]) == 7:
  116.             y_test3[h] = 1
  117.         else:
  118.             y_test3[h] = 0
  119.     # 以上两步都是为了将源数据的one hot编码改为1和0,我的学号尾数为7
  120.     x_temp = []
  121.     for g in x_test2:
  122.         x_temp.append(sess.run(h_fc1, feed_dict={x: np.array(g).reshape((1, 256))})[0])
  123.     # 将原来的x带入训练好的CNN中计算出来全连接层的特征向量,将结果作为SVM中的特征向量
  124.     x_temp2 = []
  125.     for g in x_test3:
  126.         x_temp2.append(sess.run(h_fc1, feed_dict={x: np.array(g).reshape((1, 256))})[0])
  127.     clf = svm.SVC(C=0.9, kernel='linear'#linear kernel
  128. #    clf = svm.SVC(C=0.9, kernel='rbf')   #RBF kernel
  129.     # SVM选择了RBF核,C选择了0.9
  130. #    x_temp = preprocessing.scale(x_temp)  #normalization
  131.     clf.fit(x_temp, y_test2)
  132.     
  133.     print('svm testing accuracy:')
  134.     print(clf.score(x_temp2,y_test3))
  135.     for j in range(len(x_temp2)):
  136.         # 验证时出现四种情况分别对应四个变量存储
  137.         #这里报错了,需要对其进行reshape(1,-1)
  138.         if clf.predict(x_temp2[j].reshape(1,-1))[0] == y_test3[j] == 1:
  139.             right0 += 1
  140.         elif clf.predict(x_temp2[j].reshape(1,-1))[0] == y_test3[j] == 0:
  141.             right1 += 1
  142.         elif clf.predict(x_temp2[j].reshape(1,-1))[0] == 1 and y_test3[j] == 0:
  143.             error0 += 1
  144.         else:
  145.             error1 += 1
  146.     
  147. accuracy = right0 / (right0 + error0)  # 准确率
  148. recall = right0 / (right0 + error1)  # 召回率
  149. print('svm right ratio ', (right0 + right1) / (right0 + right1 + error0 + error1))
  150. print ('accuracy ', accuracy)
  151. print ('recall ', recall)
  152. print ('F1 score ', 2 * accuracy * recall / (accuracy + recall))  # 计算F1值
  153. end = time.clock()
  154. print("time is :")
  155. print(end-start)

使用CNN之后用SVM分类。这个操作有很多。比如RCNNRegions with CNN features)用于目标检测的网络的一系列的算法【SPP-Net】。基本就是CNN之后svm

参考文献

[1] Deep Learning using Linear Support Vector Machines, ICML 2013

[2] How transferable are features in deep neural networks?, Jason Yosinski,1 Jeff Clune,2 Yoshua Bengio, NIPS 2014

[3] CNN Features off-the-shelf: an Astounding Baseline for Recognition, Ali Sharif Razavian Hossein Azizpour Josephine Sullivan Stefan Carlsson CVAP, KTH (Royal Institute of Technology). CVPR 2014

主要参考第一篇,具体的论文我把论文放到百度网盘中了:

https://pan.baidu.com/s/1Ghh4nfjfBKDyA47fc6M4JQ

有相同的CNN之后使用SVM的一些GitHub的开源代码:

https://github.com/Fdevmsy/Image_Classification_with_5_methods

https://github.com/efidalgo/AutoBlur_CNN_Features

https://github.com/tomrunia/TF_FeatureExtraction



本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/295827
推荐阅读
相关标签
  

闽ICP备14008679号