赞
踩
资源下载地址:https://download.csdn.net/download/sheziqiong/85979831
资源下载地址:https://download.csdn.net/download/sheziqiong/85979831
术语罗列
1962年受Hubel和Wiesel对猫视觉皮层电生理研究启发,Kunihiko Fukishima(福岛邦彦)最先提出了卷积神经网络(CNN),近年来卷积神经网络发展迅速,在语音识别、人脸识别、通用物体识别、运动分析。tensorflow为手写字符推荐的算法就是卷积神经网络,模型识别率高达99.6%
神经网络过程图
具体过程就是。神经信号x乘上权重向量w,经过输入函数(Net input function)求和后,由激活函数(Activation function)输出。监督学习过程中,输出结果将会对比数据集样本结果(label),使用损失函数(cost function)计算损失,并且经过优化器迭代后更新权重。
神经网络隐含层
注意:Layer L1 为输入层,L2为隐含层,L3为输出层,h(x)为假设函数
这种神经网络叫做反向传播(Back Propagation)神经网络,简称BP网络,一般使用**sigmoid(s型)**激活函数。
卷积神经网络包含了一个由卷积层和子采样层构成的特征抽取器。
卷积层通常包含若干个特征平面(featureMap),每一个特征平面由一些矩形排列的神经元组成,同一特征平面的神经元共享权值,这个共享权值就是卷积核。卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中卷积核将学习得到合理的权值。
子采样也叫做池化(pooling),通常有均值采样(mean poooling)和 最大值采样(max pooling)两种形式。
卷积神经网络分为了三部分,第一部分为输入层,第二部分由若干个卷积层和池化层 组成,第三部分为一个全连接的多层感知分类器构成。
卷积神经网络
Convolutional layer :卷积层
Pooling layer :池化层
Fully connected layer: 全连接层
卷积层工作原理
卷积层工作原理
卷积层的作用就是把数据通过weight变成特征向量。
池化层工作原理
池化层的作用就是把数据用最大值或者平均值代替。达到降低数据量的目的。
tf.nn.conv2d(input,#输入的应该是一个四维图像数据[batch,in_height,in_width,in_channels]
filter, #卷积核的四维数据[height,width,in_channels,out_channels]
trides,
padding,
use_cudnn_on_gpu=None,
data_format=None,#表示输入的格式默认为NHWC
name=None)
\2. tensorflow 的池化层
tf.nn.max_pool(value,#输入的是一个四维数据[batch,height,width,channels]
ksize,# 池化窗口大小[1,height,width,1]
strides,
padding,
data_format=’NHWC’,
name=None)
1.安装tensorflow
pip install tensorflow 或者 pip install tensorflow-gpu
\2. 安装PIL
推荐使用whl进行安装 :Pillow的地址
\3. 安装科学计算库numpy
pip install numpy
这一步,我们引入了所需的库,并且声明了一个changeImage的转换方法
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets("/tmp/data/", one_hot=True) from PIL import Image import base64 import re import numpy as np import time # 创建一个changeImage方法将base64图片转化为模型可用的数据集,方便服务器之间传输 def changeImage(dataUrl): dataUrl = re.sub('^data:image/.+;base64,','',dataUrl) image_s = base64.b64decode(dataUrl) fileName ='test.jpg' file= open(fileName,'wb') file.write(image_s) file.close() img = Image.open('./test.jpg').convert('L') if img.size[0] != 28 or img.size[1] != 28: img = img.resize((28, 28)) arr = [] for i in range(28): for j in range(28): pixel = 1.0 - float(img.getpixel((j, i)))/255.0 arr.append(pixel) image_data = np.array(arr).reshape((1,784)) return image_data
这一步,我们声明了一些神经网络的参数
learning_rate = 0.001 #学习率
batch_size = 128 #批大小
num_steps = 500 #使用的样本数量
display_step = 50 #显示间隔
num_input = 784 #image shape:28*28
num_classes = 10 # MNIST total classes (0-9 digits)
dropout = 0.75 #用于随机丢弃,防止过拟
X = tf.placeholder(tf.float32, [None, num_input])
Y = tf.placeholder(tf.float32, [None, num_classes])
keep_prob = tf.placeholder(tf.float32)
创建我们的模型
def conv2d(x, W, b, strides=1): # Conv2D wrapper, with bias and relu activation x = tf.nn.conv2d(x, W, strides=[1, strides, strides, 1], padding='SAME') x = tf.nn.bias_add(x, b) return tf.nn.relu(x) def maxpool2d(x, k=2): # MaxPool2D wrapper return tf.nn.max_pool(x, ksize=[1, k, k, 1], strides=[1, k, k, 1], padding='SAME') # 创建模型 def conv_net(x, weights, biases, dropout): x = tf.reshape(x, shape=[-1, 28, 28, 1]) # Convolution Layer conv1 = conv2d(x, weights['wc1'], biases['bc1']) # Max Pooling (down-sampling) conv1 = maxpool2d(conv1, k=2) # Convolution Layer conv2 = conv2d(conv1, weights['wc2'], biases['bc2']) # Max Pooling (down-sampling) conv2 = maxpool2d(conv2, k=2) # Fully connected layer # Reshape conv2 output to fit fully connected layer input fc1 = tf.reshape(conv2, [-1, weights['wd1'].get_shape().as_list()[0]]) fc1 = tf.add(tf.matmul(fc1, weights['wd1']), biases['bd1']) fc1 = tf.nn.relu(fc1) # Apply Dropout fc1 = tf.nn.dropout(fc1, dropout) # Output, class prediction out = tf.add(tf.matmul(fc1, weights['out']), biases['out']) return out
设置我们的权重和偏移,损失函数,梯度下降,初始化参数,初始化模型保存
# 设置权重和偏移 weights = { # 5x5 conv, 1 input, 32 outputs 'wc1': tf.Variable(tf.random_normal([5, 5, 1, 32])), # 5x5 conv, 32 inputs, 64 outputs 'wc2': tf.Variable(tf.random_normal([5, 5, 32, 64])), # fully connected, 7*7*64 inputs, 1024 outputs 'wd1': tf.Variable(tf.random_normal([7*7*64, 1024])), # 1024 inputs, 10 outputs (class prediction) 'out': tf.Variable(tf.random_normal([1024, num_classes])) } biases = { 'bc1': tf.Variable(tf.random_normal([32])), 'bc2': tf.Variable(tf.random_normal([64])), 'bd1': tf.Variable(tf.random_normal([1024])), 'out': tf.Variable(tf.random_normal([num_classes])) } # Construct model logits = conv_net(X, weights, biases, keep_prob) prediction = tf.nn.softmax(logits) pred = tf.argmax(prediction, 1) # Define loss and optimizer loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits( logits=logits, labels=Y)) optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate) train_op = optimizer.minimize(loss_op) # Evaluate model correct_pred = tf.equal(pred, tf.argmax(Y, 1)) accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32)) init = tf.global_variables_initializer() saver = tf.train.Saver(tf.trainable_variables())
声明我们的训练函数,保存模型
def train(): sess.run(init) for step in range(1,num_steps+1): batch_x, batch_y = mnist.train.next_batch(batch_size) # Run optimization op (backprop) sess.run(train_op, feed_dict={X: batch_x, Y: batch_y, keep_prob: dropout}) if step % display_step == 0 or step == 1: # Calculate batch loss and accuracy loss, acc = sess.run([loss_op, accuracy], feed_dict={X: batch_x, Y: batch_y, keep_prob: 1.0}) print("Step " + str(step) + ", Minibatch Loss={:.4f}".format(loss) + ", Training Accuracy={:.3f}".format(acc)) print(sess.run(accuracy, feed_dict={X: mnist.test.images[:500], Y: mnist.test.labels[:500], keep_prob: 1.0})) save_path = saver.save(sess,"../tmp/model.ckpt") print("save success in:"+save_path)
训练和识别一张图片
with tf.Session() as sess:
train()
# 训练完成之后就可以使用模型通过图片直接预测手写字母了
# saver.restore(sess, "../tmp/model.ckpt")
# arr1 = changeImage("")
# print(sess.run(pred,feed_dict={X:arr1,keep_prob: 1.0}))
# 如果训练成功,那么你输出的应该这张base64图片的数字[8]
上传一张结果图
资源下载地址:https://download.csdn.net/download/sheziqiong/85979831
资源下载地址:https://download.csdn.net/download/sheziqiong/85979831
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。