每天五分钟计算机视觉：基于YOLO算法精确分类定位图片中的对象

作者：从前慢现在也慢 | 2024-04-24 11:29:40

踩

滑动窗口的卷积的问题

滑动窗口的卷积实现效率很高，但是它依然不能够输出最精准的边界框，比如下面所示：

我们可以看到蓝色框不论在什么位置都不能很好的确定车的位置，有一个算法是YOLO 算法它能够帮助我们解决这个问题。

比如我们的输入图像是100*100，我们会在图像上放一个网格。这个网络要用比较精细的，比如19*19，但是为了讲解方便，我们使用3*3的网格

比如本张图像就被分成了九个小格子了。然后我们使用图像分类和定位算法应用到每一个小格子上，也就是我们将每一个小格子看成是一个样本，对每一个小格子都应用图像分类定位算法，具体来说就是1、2、3、7、8、9样本的标签是这样的

而5格子是有一点争议的，因为看起来6的车有一点在5位置，为了让图片中的目标只属于一个格子，yolo算法规定目标的中心点在哪个格子，那么这个物体就属于哪个格子，很明显6中的那个白车目标的中心点在6中，所以我们认为白车在6中，而5中什么都没有，所以5的标签也是

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/479150