当前位置:   article > 正文

计算机视觉理论笔记 (13) - 物体检测 (Object Detection)_object detection 实例

object detection 实例

物体检测

总览

给定图像或者视频序列,定位感兴趣的对象的所有实例。该问题对应于确定包围对象 (enclose the objects) 的图像或视频序列中的区域,通常是最小的矩形边界框 (smallest rectangular bounding boxes)。
在这里插入图片描述
要求对于 视点,比例,明度,遮挡和姿势 (viewpoint, scale, illumiation, occlusion, pose) 都具有不变性。

流程

  1. 生成和选择区域 (图像块 patches)
  2. 在一定规模上进行对象识别 (object recognition)
  3. 合并多个重叠的正区域(overlapped positive regions)。

有两个策略:
在这里插入图片描述

生成区域 (Generation of Regions)

滑动窗口算法

在图像上滑动框或者窗口 (box or window) 已选择图像块 (patch)。这是对整个图像和不同比例的对象 (different scales) 的详尽搜索 (exhaustive search)。这可能会导致成千上万的图像补丁 (image patches)。
这种方法适用于固定宽高比 (aspect ratio) 的对象,比如人脸或者行人。
当我们搜索多个宽高比时,这个方法在计算上非常昂贵。
在这里插入图片描述

区域提案 (Region Proposal)

输出与图像中最有可能是对象的所有 图像块 相对应的边界框 (output bounding boxes)。
这些区域提案可能会带有噪声,重叠 (overlapping) 且可能无法完美地包含对象,但我们期望会有一个非常接近图像中的实际对象的提案。
区域提案算法 (Region Proposal Algorithms) 使用 分割 (Segmentation) 来识别图像中的预期对象 (prospective objects)。

选择性搜索是通用算法之一。

选择性搜索 (Selective Search)

该方法根据颜色,纹理,大小和形状兼容性(color, texture, size and shape)计算相似区域的层次分组 (hierarchical grouping)。建立在过度分割(oversegments)之上。
在这里插入图片描述
从 过度分割 开始,反复执行以下操作:

  • 将 分割片段(segmented part) 相对应的所有边界框 (bounding box) 添加到 区域提案 中。
  • 根据相似度将相邻的片段(adjacent segments)分组。
    在这里插入图片描述
相似度 (similarity)
  • 颜色相似度 (color similarity): 有一个每个通道带有25个bin的颜色直方图,每个区域 25 x 3 = 75-D 颜色描述符(color descriptor)。
    在这里插入图片描述

  • 纹理相似度 (texture similarity): 每个通道在8个方向 (8 orientation) 上的高斯导数 (Gaussian derivatives)。每个方向和每个颜色通道的 10 bin 直方图,每个区域 10 x 8 x 3 = 240-D 特征描述符 (feature descriptor)。
    在这里插入图片描述

  • 尺寸相似度 (size similarities): 鼓励更小的区域更早进行合并。
    在这里插入图片描述
    其中 size(im) 是 图中像素的多少。

  • 形状兼容性 (shape compatibility):
    在这里插入图片描述
    其中 size(BBij) 是 覆盖两个区域的边界框的大小。

  • 最终相似度 (Final similarity): 本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/718816

推荐阅读
相关标签