物体检测框架 RetinaNet 深度神经网络简介

作者：我家小花儿 | 2024-07-18 22:35:45

踩

retinanet

作者：禅与计算机程序设计艺术

1.简介

在计算机视觉领域，物体检测（Object Detection）一直是一个重要且具有挑战性的问题。最近几年基于深度学习的方法取得了突破性的进步，在上采样，骨干网络，非极大值抑制， Anchor-based 方法等多个方面都取得了不错的成绩，但是仍然存在一些不足。如速度慢，推理时间长等问题。近年来随着人工智能的发展，对模型的要求也越来越高，希望能够有更好的方法提升模型性能，减少计算量，更好地适应多目标跟踪任务。因此RetinaNet便应运而生。 RetinaNet是Facebook AI Research团队于2017年提出的一种新型物体检测框架，其核心在于设计了一种新的损失函数来解决类别不平衡的问题，并通过引入anchor-free的方式来进行边框回归。如此一来，RetinaNet可以解决类别不平衡问题，并且可以获得更加精确的预测框。

一、相关背景介绍

（1）什么是物体检测？

物体检测(Object Detection)是计算机视觉的一个子任务，它旨在从图像或视频中识别出感兴趣的目标对象及其位置。具体来说，就是在给定一张图像或是视频帧时，确定图像中是否有目标物体存在，并对这些物体的位置及类别作出预测。

（2）为什么要做物体检测？

在许多应用场景下，需要对图像或视频中的物体进行探测和跟踪。例如，城市环境监控系统、智能安防系统、工业自动化等都需要对视频中的车辆、行人、交通工具等进行检测和跟踪。另外，在搜索引擎、移动互联网、智能手机APP等平台上&#x

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/我家小花儿/article/detail/848122