赞
踩
GRU 是最近几年提出来的,在 LSTM 之后,是一个稍微简化的变体,通常能够提供同等的效果,并且计算速度更快
在某些情况下,希望存在某些机制能够实现:
做 RNN 的时候处理不了太长的序列
在观察一个序列的时候,不是每个观察值都同等重要
在 RNN 中没有特别关心某些地方的机制,对于它来讲仅仅是一个序列,而门控循环单元可以通过一些额外的控制单元,使得在构造隐藏状态的时候能够挑选出相对来说更加重要的部分**(注意力机制在这方面强调得更多一点)**
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。