当前位置:   article > 正文

lstm不收敛_LSTM学习笔记

lstm不收敛

60890aa2bae4cc8da7b635b47e2ed6b4.png

最近实验中需要用到LSTM,记录下我对LSTM的理解。

什么是LSTM?

首先介绍一下标准的RNN,它拥有记忆能力,适合处理序列型的数据,比如语音识别,但它有有以下缺点:

  • 只能记住非常短的序列
  • 难以训练,收敛困难

dcbd2d42008481e884e338fcd63ba336.png
RNN的结构

LSTM全名“长短期记忆神经网络”,正好解决了RNN的缺点。LSTM会选择性忘记不重要的信息,因此它能记住更长的序列,且它更容易训练

af720c9e0b5f7031ba727263b338004d.png
LSTM的结构

LSTM的关键是单元࿰

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/313943
推荐阅读
相关标签
  

闽ICP备14008679号