当前位置:   article > 正文

每天五分钟计算机视觉:基于YOLO算法精确分类定位图片中的对象

每天五分钟计算机视觉:基于YOLO算法精确分类定位图片中的对象

滑动窗口的卷积的问题

滑动窗口的卷积实现效率很高,但是它依然不能够输出最精准的边界框,比如下面所示:

我们可以看到蓝色框不论在什么位置都不能很好的确定车的位置,有一个算法是YOLO 算法它能够帮助我们解决这个问题。

YOLO 算法

比如我们的输入图像是100*100,我们会在图像上放一个网格。这个网络要用比较精细的,比如19*19,但是为了讲解方便,我们使用3*3的网格

比如本张图像就被分成了九个小格子了。然后我们使用图像分类和定位算法应用到每一个小格子上,也就是我们将每一个小格子看成是一个样本,对每一个小格子都应用图像分类定位算法,具体来说就是1、2、3、7、8、9样本的标签是这样的

而5格子是有一点争议的,因为看起来6的车有一点在5位置,为了让图片中的目标只属于一个格子,yolo算法规定目标的中心点在哪个格子,那么这个物体就属于哪个格子,很明显6中的那个白车目标的中心点在6中,所以我们认为白车在6中,而5中什么都没有,所以5的标签也是

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/479150
推荐阅读
相关标签
  

闽ICP备14008679号