赞
踩
Basic RNN、LSTM由于它们独特的架构,被大量应用在自然语言处理和序列模型的任务上。通过它们自身特殊的结构,可以记住之前的输入中的部分内容和信息,并对之后的输出产生影响。
模型的整体结构如下图所示,输入的是序列x、输出y,长度为Tx。当然还有针对输入输出不相等的RNN结构,这里只是为了详解RNN的公式推导,特别是反向传播的推导,所以不再赘述。
针对前面介绍的每个cell前向传播图和公式,我们能很快的写出针对每个cell的反向传播公式:
由前向传播的单个cell图,根据梯度反向传播易知。当前cell的
- 当前cell的输出
- 输入到下一个cell的a< t >传回的梯度da< t >2
公式推导前我们还需要知道
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。