赞
踩
RNN用gradient decent train的效果很差,是因为RNN有time sequence,w会在不同时间点被反复使用,会产生gradient vanish问题。
LSTM可以handle gradient decent的问题,需要在learning rate很小的情况下train。
为什么要用LSTM代替RNN?
RNN在每个时间点,memory中的data都会被覆盖掉,而LSTM有一个forget gate,会把memory中的值乘上一个值再加上input。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。