当前位置:   article > 正文

深度学习五大神经网络 1

五大神经网络

深度学习五大神经网络(CNN、RNN、GAN、GNN、LSTM)

参考7-前向传播整体流程_哔哩哔哩_bilibili

目录

一、深度学习要解决的问题

二、计算机视觉任务

◼ 图形分类任务:

◼ 计算机视觉面临的挑战:

◼ K近邻算法

三、得分函数

◼ 线性函数

四、损失函数的作用


一、深度学习要解决的问题

机器学习的流程:

  • 数据获取
  • 特征工程(重要)
  • 建立模型
  • 评估与应用

问题:为什么需要深度学习?

深度学习会自动学习,自动特征工程提取。去学什么样的特征是最合适的。

二、计算机视觉任务

◼ 图形分类任务:

图形表示:计算机眼中的图像,一张图片被表示成三维数组的形式,每个像素值为0-255(亮),例如:300*100*3为H*W*颜色通道。

◼ 计算机视觉面临的挑战:

 

 

◼ K近邻算法

数据:两类点:方块,三角

那么绿色的点是属于方块还是三角?K=3还是K=5?结果是一样的吗?

 K近邻算法的计算流程:

  1. 计算已知类别的数据集中的点与当前点的距离;
  2. 安装距离依次排序;
  3. 选取与当前点距离最小的K个点;
  4. 确定前K个点所在类别的出现概率;
  5. 返回前K个点出现频率最高的类别作为当前点的预测分类;

那么使用K近邻算法来进行图像分类任务,

测试结果:部分结果还可以,但是没有分类对的图像,问题出在哪里呢?

 问题:为什么K近邻算法不适合用来图像分类任务?

得到的结果当中,把北京相同相似的图像都放到了一起。因为我们现在拿到的数据,有些它是个主题,比如一个马,一个马只占到图像的一部分,但是K近邻算法不知道什么是主体,什么是背景,没有一个学习的过程。背景主导是一个最大的问题,我们关注的其实是主体(主要成分)

那么如何才能让机器学习学习到哪些是重要的成分呢?

三、得分函数

◼ 线性函数

从输入到输出的映射:

猫是由32x32x3=3072个像素点来决定的,那么猫眼睛和耳朵,与背景的影响肯定是不一样的,有些像素点对于是猫起到一个促进作用,有些像素点对于是猫起到一个抑制作用。------权重参数W

比如说我要算一个10分类任务,那就需要算它属于10个类别各自的得分值,

我们一共需要几组权重参数,是根据分类任务得到的。也就是说W一共需要10个。

此处的b:偏置参数,微调,每一组进行w权重计算之后,都要分别进行能微调,各自类别各自微调

四、损失函数的作用

比如说我要算一个3分类任务,

  • 3x4:3代表3个类别,4代表猫有4个像素点;
  • 当权重参数的值比较大时,当前的结果对当前的类别影响比较大。
  • 权重参数正值代表促进作用,负值代表抑制作用;

我们刚开始随机给定一个3x4的权重,分类结果显示把图像错误判断成了狗,

问题:那么为什么会产生这样一个现象?

是因为数据不好吗,肯定不是,数据x不会变,说明W不好。那么就需要在迭代过程中,用一种优化方法来不断去改进参数。

那么损失函数如何衡量分类的结果呢?结果的得分有着明显的差异,我们需要明确的指导模型的当前效果,有多好或者有多差。

 当它做第一个分类时,效果不好则损失函数为2.9,较高。当它做第2个分类时,效果还行,4.9比1.3和2.0高出了至少1,那么则损失函数为0,无损失。当它做第3个分类时,效果非常不好则损失函数为10.9。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/天景科技苑/article/detail/939728
推荐阅读
相关标签
  

闽ICP备14008679号