搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
知新_RL
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
Shell 实现Docker MySQL5.7安装及SQL脚本运行_docker 安装mysql5.7 并执行脚本 csdn
2
opencv人脸打马赛克
3
鸿蒙OS开发问题:【尺寸适配算法】_鸿蒙os开发尺寸适配
4
传感器驱动系列之HX711称重模块
5
2023年度AI技术盘点:突飞猛进的技术进展与未来挑战_人工智能最新技术发展成果
6
数据结构九:线性表之链式队列的设计
7
【后端】Redis命令行批量删除指定前缀key_err wrong number of arguments for 'del' command
8
java调试技巧_分享5个实用的vs调试技巧
9
npm install 你很明白吗
10
SMSBoom:强大的短信自动化工具,让信息管理更高效
当前位置:
article
> 正文
7.2-循环神经网络_循环神经网络输入序列
作者:知新_RL | 2024-05-16 14:42:26
赞
踩
循环神经网络输入序列
一、
循环神经网络
(Recurrent Neural Network)
有记忆的神经网络就是循环神经网络(
RNN
)
1.1 槽填充(Slot Filling)
如下图,一个关键元素就是一个槽位(Slot),从用户交互中抽取出的这个槽位对应的取值,就是填充(Filling)
下图的槽位(Slot)有两个,分别是目的地(destination)和到达时间(arrival time)
我们是可以用之前学过的前馈网络(Feedforward network)来解决槽填充的问题的
首先输入是一个单词,每个单词都代表一个向量
输出代表输入单词属于这些槽位(Slot)的概率分布
1.2 1-of-N Encoding
vector中元素数量就等于所有word的数量,
对1个单词来说只需要vector中对应元素为1,其余元素都是0即可
但
这种vector一点都不信息丰富(informative)
,任意两个vector都是不一样的,无法建立起同类word之间的联系(比如cat和dog都是动物)。
1.3 RNN工作原理
RNN中的隐藏层的输出被存储在存储器(store)中,存储器可以被认为是另一种输入,存储器在输入之前需要给定初始值。
因此改变输入的序列顺序(sequence order)将会改变输出,因此就很好的解决了同一个输入在不同场景下如何使输出变得不同的问题。
下图中的示例是单个隐层的网络,当然也可以叠很多层,做成深度神经网络
1.4 Elman Network & Jordan Network
Elman Network
就是上面介绍的网络结构,即将
隐层输出
存起来,等到下一个时间点再读出来。
Jordan Network
它存的是
整个网络最终的输出值
,等到下一个时间点再读出来。
由于
Elman Network
的隐层输出是没有目标(target)的,因此难以控制说它会学到什么样的隐层信息。一般情况下
Jordan Network
的表现要好很多。
Bidirectional RNN
由于之前的RNN网络只能记住上文,而无法记住下文,为了解决这个问题。如下图,我们会将网络设计成双向的,从而达到根据上下文来推断语义的功能。
二、长短期记忆网络 (Long Short-term Memory)
长短期记忆网络(LSTM)有4个输入,1个输出。其中3个输入分别为:输入门(input gate)的控制信号
z i z_i
z
i
,遗忘门(forget gate)的控制信号
z f z_f
z
f
,输出门(output gate)的控制信号
z 0 z_0
z
0
。
其工作原理如下图
激活函数 f 通常是一个sigmoid函数,其输出介于0和1之间
输入
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/知新_RL/article/detail/579240
推荐阅读
article
吴恩达
2022机器
学习
专项课程C2(高级
学习
算法)W1(
神经网络
):
2.6
推理:进行
预测
(
前向
传播
...
前向
传播
表示
神经网络
中,用于从输入层到输出层传递数据并计算最终
预测
结果的过程。本案例是从左到右计算,x计算到a[1]到a...
赞
踩
article
吴恩达
2022
机器
学习
专项课程C2(高级
学习
算法)W1(
神经网络
):
2.3
案例
图像识别
...
本例中,第一层中查找短小的边缘,第二层中查找眼睛和鼻子等面部部位,然后在第三层中查找更完整的面部形状。第一个隐藏层的输出...
赞
踩
article
图像识别
(一): 深度
学习
TensorFlow
框架+
神经网络
VS 机器
学习
SKlearn+
随机
森...
正在
学习
TensorFlow
2.0,为了更好的理解数据建模分类问题,对比不同算法的差异和原理,利用入门级的
图像识别
案例,...
赞
踩
article
【
神经网络
】(1)
简单网络
,
实例:气温
预测
,
附
python
完整代码和
数据
集_
神经网络
预测
模型
实例...
各位同学好
,
今天和大家分享一下TensorFlow2.0深度学习中的一个小案例。案例内容:现有348个气温样本
数据
,
每个...
赞
踩
article
C#
使用
ML
.
NET
实现机器学习/
神经网络
,
实现分析情绪(二元分类)问题_
ml
c#
...
VS软件开发工具越来越强大
,
针对.
NET
开发2019年6月26号上线了机器学习框架
ML
.
NET
,
但是只针对Visual ...
赞
踩
相关标签
机器学习
学习
算法
神经网络
深度学习
tensorflow
数据挖掘
python