赞
踩
目标检测(object detection)是计算机视觉领域中一个重要且具有挑战性的问题。其主要任务是在图像或者视频序列中识别出物体的位置和类别。近年来,随着各种深度学习技术、网络结构的提升以及计算硬件性能的提升,目标检测技术也在不断得到改进。本文将介绍如何用Python实现目标检测,以及相关算法的基础知识。
目标检测主要由三种类型的实体组成:输入图像、候选区域(Bounding box)、类别(class)。其中,输入图像是指待检测物体所在的场景或摄像头采集到的帧;候选区域是一个矩形框,其大小和位置描述了待检测物体的位置;类别则是待检测物体所属的类别标签,通常包括目标物体、背景等。 基于这样的定义,下面介绍目标检测的基本概念、相关术语及概念之间的关系。
输入图像一般采用灰度图或者RGB彩色图表示。输入图像分辨率可以达到几百万像素,所以对于较大的图像,需要进行分块处理才能有效地进行目标检测。
候选区域是指图像中的感兴趣区域。如果图像中只有一种物体类型,那么候选区域就是图像中的所有区域。如果图像中存在多种物体类型,那么候选区域就对应不同的物体。候选区域一般为矩形框,框的大小和位置描述了目标物体的位置。
分类是指候选区域对应的目标物体类别。例如,在给定候选区域内的图像中检测狗、鸟、猫等不同的生物,每个生物就对应一个不同类别。
候选区域由锚框(Anchor boxes)进行
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。