当前位置:   article > 正文

MIT《深度学习导论(6.S191)》课程(2021) 学习笔记_深度学习 mit

深度学习 mit

先上B站链接:MIT《深度学习导论(6.S191)》课程(2021)

1. 全连接神经网络(Fully-connected NN, Dense layer)

引言

Why deep learning?

手工进行特征工程耗时耗力,实践中难以大规模应用。
使用深度学习,可以直接从数据中获取其潜在特征。

深度学习的特征分层思想

例如:人脸识别中,底层特征(点、线)→中层特征(眼、鼻)→高层特征(人脸)

神经网络

感知器,神经元(The Perceptron)

即神经元
在这里插入图片描述
在这里插入图片描述

三大激活函数

在这里插入图片描述
非线性激活函数使得神经网络可以拟合非线性问题:
在这里插入图片描述

单层全连接神经网络

多个神经元组成单层神经网络
在这里插入图片描述

损失函数(Loss)

损失函数衡量理论输出与实际输出的差距:
在这里插入图片描述
经验损失函数:
在这里插入图片描述

训练,反向传播(backpropagation,BP)

训练的目的是找到使损失函数达到最小的参数,注意数据集确定后,loss成为参数的函数。

梯度下降算法

在这里插入图片描述

链式法则的应用

在这里插入图片描述

参数更新量 = 梯度方向 × 学习率幅值

优化

自适应学习率与合适的梯度下降算法

在这里插入图片描述
在这里插入图片描述

mini-batch

mini-batch有两大优点
在这里插入图片描述

预防过拟合
正则化(Regularization)
Dropout

随机使用部分神经元,保证神经网络不依赖某些神经元,理想情况下,任意神经元被废除时,神经网络也能预测正确的结果。
使用Dropout还能加快训练速度,因为训练时的计算量更小了。
在这里插入图片描述

及时停止训练

很好理解
在这里插入图片描述

2. 循环神经网络(Recurrent NN)

引言

为了预测顺序序列而提出的网络结构。
现实中存在大量顺序序列,如股票价格,心电图,句子,音频,视频等
在这里插入图片描述

循环神经网络

三种网络结构

全连接神经网络是 1-1结构;
循环神经网络可以是 n-1,1-n,n-n结构。
在这里插入图片描述

神经元

在这里插入图片描述

正向传播

注意递推公式:
在这里插入图片描述
在输入序列上的展开:(注意使用的是同一组参数,这样参数量就不会受序列长度影响了)
在这里插入图片描述

处理序列的神经网络设计准则

RNN满足处理序列的设计准则:

  1. 处理变长度序列
    在这里插入图片描述

  2. 跟踪长期的依赖关系(如Xn对X1的依赖关系)
    在这里插入图片描述

  3. 捕捉顺序信息
    在这里插入图片描述

  4. 序列中共享参数

示例——预测句中单词

在这里插入图片描述

One-hot编码

在这里插入图片描述

时间上的反向传播(Backpropagation through time, BPTT)

在这里插入图片描述

标准RNN的局限性

如果计算在[1, ∞]上进行,梯度累计会发生梯度爆炸;
如果计算在[0, 1]上进行,计算累乘会发生梯度消失。
在这里插入图片描述
为了缓解这一现象,解决方法有:

  1. 使用ReLU激活函数,防止梯度缩减
    在这里插入图片描述
  2. 权值矩阵初始化为单位矩阵,偏差初始化为0,防止权值过快缩减为0
    在这里插入图片描述
  3. 使用门控单元
    在这里插入图片描述

长短期记忆网络(long short term memory, LSTM)

注意力机制

LSTM在大规模序列数据上的局限性:
在这里插入图片描述
解决方法:注意力机制
在这里插入图片描述

牛逼的应用

创造音乐
判断文字情绪
机器翻译
自动驾驶汽车的轨迹预测
环境建模与气候分析

实验

MIT Deep Learning 6.S191

卷积神经网络(Convolutional NN)

在这里插入图片描述

深度生成模型(Deep Generative Modeling)

网络不是用于学习数据模式,而是用于生成数据本身:
在这里插入图片描述
(All fake, generated)

监督学习 vs 无监督学习

在这里插入图片描述

应用

  1. 去偏差
    在这里插入图片描述
  2. 检测离群数据
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/371684
推荐阅读
相关标签
  

闽ICP备14008679号