赞
踩
通过之前的文章我们知道了,构建一个简单的神经网络需要以下步骤
digits = load_digits()
X为我们的输入数据
X = digits.data
Y为我们的目标数据
Y = = digits.target
将输入数据归一化,范围变成0 到 1之间
X = (X - X.min()) / (X.max() - X.min())
将数据拆分成训练集和测试集,测试数据就是我们的假设数据,用于与训练模型进行测试
x_train, x_test, y_train, y_test = train_test_split(X, Y)
将训练数据标签独热化处理
labels = LabelBinarizer().fit_transform(y_train)
没有偏置的话,分割线会经过原点,就不能正确的分类了
class NeuralNetwork:
def __init__(self, layers):
# 初始化隐藏层权值
self.w1 = np.random.random([layers[0], layers[1]]) * 2 - 1
# 初始化输出层权值
self.w2 = np.random.random([layers[1], layers[2]]) * 2 - 1
# 初始化隐藏层的偏置值
self.b1 = np.zeros([layers[1]])
# 初始化输出层的偏置值
self.b2 = np.zeros([layers[2]])
# 定义激活函数
@staticmethod
def sigmoid(x):
return 1 / (1 + np.exp(-x))
# 定义激活函数的导函数
@staticmethod
def dsigmoid(x):
return x * (1 - x)
def train(self, x_data, y_data, lr=0.1, batch=50): """ 模型的训练函数 :param x_data: 训练数据的特征 :param y_data: 训练数据的标签 :param lr: 学习率 :param batch: 每次要训练的样本数量 :return: """ # 随机选择一定批次的数据进行训练 index = np.random.randint(0, x_data.shape[0], batch) x = x_data[index] t = y_data[index] # 计算隐藏层的输出 l1 = self.sigmoid(np.dot(x, self.w1) + self.b1) # 计算输出层的输出 l2 = self.sigmoid(np.dot(l1, self.w2) + self.b2) # 计算输出层的学习信号 delta_l2 = (t - l2) * self.dsigmoid(l2) # 计算隐藏层的学习信号 delta_l1 = delta_l2.dot(self.w2.T) * self.dsigmoid(l1) # 计算隐藏层的权值变化 delta_w1 = lr * x.T.dot(delta_l1) / x.shape[0] # 计算输出层的权值变化 delta_w2 = lr * l1.T.dot(delta_l2) / x.shape[0] # 改变权值 self.w1 += delta_w1 self.w2 += delta_w2 # 改变偏置值 self.b1 += lr * np.mean(delta_l1, axis=0) self.b2 += lr * np.mean(delta_l2, axis=0)
def predict(self, x):
"""
模型的预测函数
:param x: 测试数据的特征
:return: 返回一个包含10个0-1之间数字的numpy.array对象
"""
l1 = self.sigmoid(np.dot(x, self.w1) + self.b1)
l2 = self.sigmoid(np.dot(l1, self.w2) + self.b2)
return l2
# 保存训练模型
def save(self, path):
np.savez(path, w1=self.w1, w2=self.w2, b1=self.b1, b2=self.b2)
# 加载训练模型
def load(self, path):
npz = np.load(path)
self.w1 = npz['w1']
self.w2 = npz['w2']
self.b1 = npz['b1']
self.b2 = npz['b2']
# 输入手写数字图像,返回模型预测结果 def predict_num(self, img): # 将图片转换为灰度图 img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 将图片转换为二值图 img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)[1] # 将图片转换为8*8的矩阵 img = cv2.resize(img, (8, 8)) # 将图片转换为一维向量 img = img.flatten() # 图片归一化处理 img = img / 255 # 预测图片的数字 num = self.predict(img) # 返回预测结果 return np.argmax(num)
输入层64个特征输入
隐藏层100个神经元
输出层10个神经元
nn = NeuralNetwork([64, 100, 10])
epoch = 20000
test = 400
loss = []
accuracy = []
for n in range(epoch): nn.train(x_train, labels) # 每训练一定的次数后,进行一次测试 if n % test == 0: # 用测试集测试模型,返回结果为独热编码的标签 predictions = nn.predict(x_test) # 取返回结果最大值的索引,即为预测数据 y2 = np.argmax(predictions, axis=1) # np.equal用来比较数据是否相等,相等返回True,不相等返回False # 比较的结果求平均值,即为模型的准确率 acc = np.mean(np.equal(y_test, y2)) # 计算代价函数 cost = np.mean(np.square(y_test - y2) / 2) # 将准确率添加到列表 accuracy.append(acc) # 将代价函数添加到列表 loss.append(cost) print('epoch:', n, 'accuracy:', acc, 'loss:', loss)
训练完成之后,使用测试数据对模型进行测试
pred = nn.predict(x_test)
y_pred = np.argmax(pred, axis=1)
查看模型预测结果与真实标签之间的报告
print(classification_report(y_test, y_pred))
查看模型预测结果与真实标签之间的混淆矩阵
print(confusion_matrix(y_test, y_pred))
打印出图标查看
plt.subplot(2, 1, 1)
plt.plot(range(0, epoch, test), loss)
plt.ylabel('loss')
plt.subplot(2, 1, 2)
plt.plot(range(0, epoch, test), accuracy)
plt.xlabel('epoch')
plt.ylabel('accuracy')
plt.show()
可以看到准确率则是逐渐的增加
准备一张图片
保存为5.png
img = cv2.imread('5.png')
print("识别的数字为:",nn.predict_num(img))
import numpy as np import cv2 from matplotlib import pyplot as plt from sklearn.datasets import load_digits from sklearn.preprocessing import LabelBinarizer from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report, confusion_matrix import os # 数据库路径 MODEL_PATH = "sklen_num_model.npz" class NeuralNetwork: def __init__(self, layers): # 初始化隐藏层权值 self.w1 = np.random.random([layers[0], layers[1]]) * 2 - 1 # 初始化输出层权值 self.w2 = np.random.random([layers[1], layers[2]]) * 2 - 1 # 初始化隐藏层的偏置值 self.b1 = np.zeros([layers[1]]) # 初始化输出层的偏置值 self.b2 = np.zeros([layers[2]]) # 定义激活函数 @staticmethod def sigmoid(x): return 1 / (1 + np.exp(-x)) # 定义激活函数的导函数 @staticmethod def dsigmoid(x): return x * (1 - x) def train(self, x_data, y_data, lr=0.1, batch=50): """ 模型的训练函数 :param x_data: 训练数据的特征 :param y_data: 训练数据的标签 :param lr: 学习率 :param batch: 每次要训练的样本数量 :return: """ # 随机选择一定批次的数据进行训练 index = np.random.randint(0, x_data.shape[0], batch) x = x_data[index] t = y_data[index] # 计算隐藏层的输出 l1 = self.sigmoid(np.dot(x, self.w1) + self.b1) # 计算输出层的输出 l2 = self.sigmoid(np.dot(l1, self.w2) + self.b2) # 计算输出层的学习信号 delta_l2 = (t - l2) * self.dsigmoid(l2) # 计算隐藏层的学习信号 delta_l1 = delta_l2.dot(self.w2.T) * self.dsigmoid(l1) # 计算隐藏层的权值变化 delta_w1 = lr * x.T.dot(delta_l1) / x.shape[0] # 计算输出层的权值变化 delta_w2 = lr * l1.T.dot(delta_l2) / x.shape[0] # 改变权值 self.w1 += delta_w1 self.w2 += delta_w2 # 改变偏置值 self.b1 += lr * np.mean(delta_l1, axis=0) self.b2 += lr * np.mean(delta_l2, axis=0) def predict(self, x): """ 模型的预测函数 :param x: 测试数据的特征 :return: 返回一个包含10个0-1之间数字的numpy.array对象 """ l1 = self.sigmoid(np.dot(x, self.w1) + self.b1) l2 = self.sigmoid(np.dot(l1, self.w2) + self.b2) return l2 # 保存训练模型 def save(self, path): np.savez(path, w1=self.w1, w2=self.w2, b1=self.b1, b2=self.b2) # 加载训练模型 def load(self, path): npz = np.load(path) self.w1 = npz['w1'] self.w2 = npz['w2'] self.b1 = npz['b1'] self.b2 = npz['b2'] # 输入手写数字图像,返回模型预测结果 def predict_num(self, img): # 将图片转换为灰度图 img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 将图片转换为二值图 img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)[1] # 将图片转换为8*8的矩阵 img = cv2.resize(img, (8, 8)) # 将图片转换为一维向量 img = img.flatten() # 图片归一化处理 img = img / 255 # 预测图片的数字 num = self.predict(img) # 返回预测结果 return np.argmax(num) # 定义一个2层的网络模型:64-100-10 nn = NeuralNetwork([64, 100, 10]) # 如果存在数据库就加载,不存在就训练 if os.path.exists(MODEL_PATH): nn.load(MODEL_PATH) else: # 载入数据集 digits = load_digits() X = digits.data Y = digits.target # 数据归一化 X = (X - X.min()) / (X.max() - X.min()) # 将数据拆分成训练集和测试集 x_train, x_test, y_train, y_test = train_test_split(X, Y) # 将训练数据标签化为独热编码 labels = LabelBinarizer().fit_transform(y_train) # 训练周期 epoch = 20001 # 测试周期 test = 400 # 用来保存测试时产生的代价函数的值 loss = [] # 用来保存测试过程中的准确率 accuracy = [] for n in range(epoch): nn.train(x_train, labels) # 每训练一定的次数后,进行一次测试 if n % test == 0: # 用测试集测试模型,返回结果为独热编码的标签 predictions = nn.predict(x_test) # 取返回结果最大值的索引,即为预测数据 y2 = np.argmax(predictions, axis=1) # np.equal用来比较数据是否相等,相等返回True,不相等返回False # 比较的结果求平均值,即为模型的准确率 acc = np.mean(np.equal(y_test, y2)) # 计算代价函数 cost = np.mean(np.square(y_test - y2) / 2) # 将准确率添加到列表 accuracy.append(acc) # 将代价函数添加到列表 loss.append(cost) print('epoch:', n, 'accuracy:', acc, 'loss:', loss) # 保存训练数据 nn.save(MODEL_PATH) # 使用测试数据对模型进行测试 pred = nn.predict(x_test) y_pred = np.argmax(pred, axis=1) # 查看模型预测结果与真实标签之间的报告 print(classification_report(y_test, y_pred)) # 查看模型预测结果与真实标签之间的混淆矩阵 print(confusion_matrix(y_test, y_pred)) # 训练结果可视化 plt.subplot(2, 1, 1) plt.plot(range(0, epoch, test), loss) plt.ylabel('loss') plt.subplot(2, 1, 2) plt.plot(range(0, epoch, test), accuracy) plt.xlabel('epoch') plt.ylabel('accuracy') plt.show() img = cv2.imread('5.png') print("识别的数字为:",nn.predict_num(img))
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。