当前位置:   article > 正文

计算机视觉之ResNet50图像分类_resnet50 优先按 颜色分类

resnet50 优先按 颜色分类

前言

图像分类是计算机视觉应用中最基础的一种,属于有监督学习类别。它的任务是给定一张图像,判断图像所属的类别,比如猫、狗、飞机、汽车等等。本章将介绍使用ResNet50网络对CIFAR-10数据集进行分类。

ResNet网络介绍

ResNet50网络是由微软实验室的何恺明提出,获得了ILSVRC2015图像分类竞赛第一名。在ResNet网络提出之前,传统的卷积神经网络堆叠到一定深度时会出现退化问题。在CIFAR-10数据集上使用56层网络与20层网络训练误差和测试误差图表明,随着网络加深,其误差并没有如预想的一样减小。 ResNet网络的提出解决了这一问题。

数据集准备与加载

CIFAR-10数据集共有60000张32*32的彩色图像,分为10个类别,每类有6000张图,数据集一共有50000张训练图片和10000张评估图片。首先,如下示例使用download接口下载并解压,目前仅支持解析二进制版本的CIFAR-10文件(CIFAR-10 binary version)。

构建网络

ResNet网络的亮点是使用残差网络结构,能够有效减轻退化问题,实现更深的网络结构设计,提高网络的训练精度。本节内容首先介绍了如何构建残差网络结构,然后讲述了如何通过堆叠残差网络来构建ResNet50网络。

构建残差网络结构

残差网络由主分支和shortcuts构成,主分支通过卷积操作得到特征矩阵

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/909895
推荐阅读
相关标签