赞
踩
ResNet-50模型图像分类示例
概述
计算机视觉是当前深度学习研究最广泛、落地最成熟的技术领域,在手机拍照、智能安防、自动驾驶等场景有广泛应用。从2012年AlexNet在ImageNet比赛夺冠以来,深度学习深刻推动了计算机视觉领域的发展,当前最先进的计算机视觉算法几乎都是深度学习相关的。深度神经网络可以逐层提取图像特征,并保持局部不变性,被广泛应用于分类、检测、分割、检索、识别、提升、重建等视觉任务中。
本文结合图像分类任务,介绍MindSpore如何应用于计算机视觉场景。
图像分类
图像分类是最基础的计算机视觉应用,属于有监督学习类别。给定一张数字图像,判断图像所属的类别,如猫、狗、飞机、汽车等等。用函数来表示这个过程如下:
def classify(image):
label = model(image)
return label
选择合适的model是关键。这里的model一般指的是深度卷积神经网络,如AlexNet、VGG、GoogLeNet、ResNet等等。
MindSpore实现了典型的卷积神经网络,开发者可以参考model_zoo。
MindSpore当前支持的图像分类网络包括:典型网络LeNet、AlexNet、ResNet。
任务描述及准备
图1:CIFAR-10数据集[1]
如图1所示,CIFAR-10数据集共包含10类、共60000张图片。其中,每类图片6000张,50000张是训练集,10000张是测试集。每张图片大小为32*32。
图像分类的训练指标通常是精度(Accuracy),即正确预测的样本数占总预测样本数的比值。
接下来介绍利用MindSpore解决图片分类任务,整体流程如下:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。