赞
踩
线性不可分问题: 无法进行线性分类。
Minsky 1969 年提出 XOR 问题
解决方法:使用多层感知机 使用多层感知机
• 在输入和输出层间加一或多隐单元,构成多层感知器(多层前馈神经网络)
• 加一层隐节点( 单元)为三层网络,可解决异或XOR )问题
由输入得到两个隐节点、一个输出层节点的输出:
可得到:
设网络有如下一组权值和阈值,可得各节点的输出:
三层感知器可识别任一凸多边形或无界的区域。
更多层感知器网络,可识别为复杂的图形。
多层感知机是一种多层前馈网络, 由多层神经网络构成,每层网络将输出传递给下一层网络。神经元间的权值连接仅现在相邻之间, 不出现在其他位置。如果每一个神经元都连接到上层的所有(除输入层外),则成为全连接网络 。
多层前馈网络的反向传播 (BP) 学习算法,简称BP算法,是有导师的学习,它是梯度下降法在多层前馈网中的应用。
网络结构:见上图,u(或x)、y是网络的输入、输出向量,神经元用节点表示,网络由输入层、隐层和输出层节点组成,隐层可一层也可多层 (图中是单隐层) ,前层至后层节点通过权联接。由于用BP学习算法,所以常称BP神经网络。
假设网络共有L层,(输入层为第0层,输出为第L层)
层:用上标[l]表示,共L层;
网络训练的目的,是使对每一个输入样本,调整网络权值参数w,使输出均方误差最小化。这是一个最优化问题。
为求解上述最小化问题,考虑迭代算法。
这就是梯度下降算法,也是BP学习算法的基本思想。
考虑二层神经网络(有一层隐含层):
对于第1层第i个神经元,其输出:
在输出端计算误差
即误差进行反向传播
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。