赞
踩
给定图像或者视频序列,定位感兴趣的对象的所有实例。该问题对应于确定包围对象 (enclose the objects) 的图像或视频序列中的区域,通常是最小的矩形边界框 (smallest rectangular bounding boxes)。
要求对于 视点,比例,明度,遮挡和姿势 (viewpoint, scale, illumiation, occlusion, pose) 都具有不变性。
有两个策略:
在图像上滑动框或者窗口 (box or window) 已选择图像块 (patch)。这是对整个图像和不同比例的对象 (different scales) 的详尽搜索 (exhaustive search)。这可能会导致成千上万的图像补丁 (image patches)。
这种方法适用于固定宽高比 (aspect ratio) 的对象,比如人脸或者行人。
当我们搜索多个宽高比时,这个方法在计算上非常昂贵。
输出与图像中最有可能是对象的所有 图像块 相对应的边界框 (output bounding boxes)。
这些区域提案可能会带有噪声,重叠 (overlapping) 且可能无法完美地包含对象,但我们期望会有一个非常接近图像中的实际对象的提案。
区域提案算法 (Region Proposal Algorithms) 使用 分割 (Segmentation) 来识别图像中的预期对象 (prospective objects)。
选择性搜索是通用算法之一。
该方法根据颜色,纹理,大小和形状兼容性(color, texture, size and shape)计算相似区域的层次分组 (hierarchical grouping)。建立在过度分割(oversegments)之上。
从 过度分割 开始,反复执行以下操作:
颜色相似度 (color similarity): 有一个每个通道带有25个bin的颜色直方图,每个区域 25 x 3 = 75-D 颜色描述符(color descriptor)。
纹理相似度 (texture similarity): 每个通道在8个方向 (8 orientation) 上的高斯导数 (Gaussian derivatives)。每个方向和每个颜色通道的 10 bin 直方图,每个区域 10 x 8 x 3 = 240-D 特征描述符 (feature descriptor)。
尺寸相似度 (size similarities): 鼓励更小的区域更早进行合并。
其中 size(im) 是 图中像素的多少。
形状兼容性 (shape compatibility):
其中 size(BBij) 是 覆盖两个区域的边界框的大小。
最终相似度 (Final similarity): 本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/718816
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。