赞
踩
目录
本文将从LSTM的本质、LSTM的原理、LSTM的应用三个方面,带您一文搞懂长短期记忆网络Long Short Term Memory | LSTM。
RNN 面临问题:RNN(递归神经网络)在处理长序列时面临的主要问题:短时记忆和梯度消失/梯度爆炸。
梯度更新规则
LSTM解决问题:大脑和LSTM在处理信息时都选择性地保留重要信息,忽略不相关细节,并据此进行后续处理。这种机制使它们能够高效地处理和输出关键信息,解决了RNN(递归神经网络)在处理长序列时面临的问题。
大脑记忆机制
RNN 工作原理:第一个词被转换成了机器可读的向量,然后 RNN 逐个处理向量序列。
逐一处理矢量序列
将隐藏状态传递给下一个时间步
tanh激活函数区间-1~1)
RNN的细胞结构和运算
LSTM工作原理:
LSTM的细胞结构和运算
sigmoid激活函数(区间0~1)
机器翻译
应用描述:LSTM在机器翻译中用于将源语言句子自动翻译成目标语言句子。
关键组件:
流程:
优化:通过比较生成的翻译句子与真实目标句子,使用反向传播算法优化LSTM模型的参数,以提高翻译质量。
情感分析:
应用描述:LSTM用于对文本进行情感分析,判断其情感倾向(积极、消极或中立)。
关键组件:
流程:
优化:通过比较预测的情感倾向与真实标签,使用反向传播算法优化LSTM模型的参数,以提高情感分析的准确性。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。