赞
踩
与CNN不同的是,RNN具有多种网络结构。联系实际很容易想到,在不同的时间段内,序列数据的长短总是不一致的。就像我们说话,每一句的长度都是不确定的。由此我们得出了以上五种基本结构。
最基本的单层网络结构,输入是 x x x,经过变换 W ⋅ x + b W·x + b W⋅x+b和激活函数 f f f得到输出 y y y。
序列型的数据不太好用原始的神经网络处理。为了处理序列建模问题,RNN引入了隐藏态 h h h(hidden state)的概念。 h h h可以对序列型的数据提取特征,接着再转换为输出。
如上图,我们从 h 1 h_1 h1开始逐步推到其计算过程。首选阐述图中网络结构的基本含义:
如图所示, h 0 h_0 h0和 x 1 x_1 x1分别有一个箭头连接 h 1 h_1 h1,表示对 h 0 h_0 h0和 x 1 x_1 x1分别作了一次变化。图中的 U U U和 W W W是参数矩阵, b b b是偏置项参数, f f f是激活函数。在经典的RNN网络结构中,通常使用 t a n h tanh tanh作为激活函数。有了 h 1 h_1 h1的计算,我们很容易可以推出之后的计算流程,每一步的过程与第一步基本一致。
这里需要特别强调的是:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。