赞
踩
收到一个任务,对交通场景中的图片进行目标检测,要能识别出指定的6个类别物品在图中的位置。比如要识别下图中的小汽车、行人、自行车、卡车等。
比如下图:
经过识别后,如图所示:
经过目标检测模型预测的图片
本系列文章共两篇,总结记录了一个计算机视觉小白,如何一步一步完成这个任务的过程,分为原理篇和实践篇,包括目标检测的原理和算法的学习;模型选择并在公开的数据集合上体验;利用模型在自己的数据集上训练、调试参数、训练加速、结果衡量等过程。
要想学透东西,我认为最好的办法还是亲自动手做一遍,解决遇到的每个问题。就像我国一首古诗所写:纸上得来终觉浅,绝知此事要躬行。做好准备,我们要开始我们的学习之旅了。
首先我们要搞明白在计算机视觉里目标检测究竟是什么?目标检测的原理是什么?
目标检测的任务是找出图像中所有感兴趣的目标(物体),确定他们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状、姿态,再加上光照、遮挡等因素的干扰,目标检测在计算机视觉中也是一项具有挑战性的任务。
机器视觉中关于目标检测有4大类任务:
这4大类任务结果如图所示:
我们要解决的目标检测任务,是一个分类问题和回归问题的叠加,分类是区分目标属于哪个类别,回归用来定位目标所在的位置。
那么,目标检测的性能评估指标都有哪些呢?常用的方法有哪些呢?
我们先思考下,图像分类问题的性能衡量用准确率就够了。比如,一个小狗的图片,我们准确地把狗识别出来。但是,这个图像分类的衡量指标不能直接用在目标检测上,因为每张图片中可能含有不同类别的不同目标。
目标检测算法的预测结果应该包含:图像、图像中的目标类别、以及每个目标的边框位置。我们用这个结构的数据和验证集的数据进行比较,来衡量目标检测的质量。例如:我们给定图片和一些边框、分类名称等解释性文字,如下:
对于这个图片,模型在训练时得到的图片可能是这样的:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。