赞
踩
牢牢记住:Wh+Ux
过程中降低了特征维度!学习低维表示,希望能无损地重构,重构误差最小
RBM可以学习数据内部特征,拟合离散分布,基于能量模型
DBN逐层无监督训练RBM,最后有监督微调
VAE 模型是一种包含隐变量的生成模型,它利用神经网络训练得到两个函数(也称为推断网络和生成网络),进而生成输入数据中不包含的数据。基于概率。
VAE 中隐藏层服从高斯分布,AE 中的隐藏层无分布要求。
训练时,AE 训练得到 Encoder 和 Decoder 模型,而 VAE 除了得到这两个模型,还获得了隐藏层的分布模型(即高斯分布的均值与方差)
AE 只能重构输入数据X,而 VAE 可以生成含有输入数据某些特征与参数的新数据。
相比于传统机器算法,GAN有三方面的优势:
基本思想:智能体,环境,状态,动作,奖励,最大化期望的奖励,监督学习与强化学习相结合
马尔可夫决策过程的定义:,状态,动作,奖励,转移概率,奖励衰减因子
状态估值函数的贝尔曼最优,贝尔曼方程:
,别忘了权重衰减因子!
注意力机制就是对输入权重分配的关注,最开始使用到注意力机制是在编码器-解码器(encoder-decoder)中, 注意力机制通过对编码器所有时间步的隐藏状态做加权平均来得到下一层的输入变量。
注意三个权重矩阵!U、V、W
同时取决于输入与前一时刻的输出
损失与梯度都是对所有的t相加!
U、V、W是共享的!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。