当前位置:   article > 正文

物体检测框架 RetinaNet 深度神经网络简介

retinanet

作者:禅与计算机程序设计艺术

1.简介

计算机视觉领域,物体检测(Object Detection)一直是一个重要且具有挑战性的问题。最近几年基于深度学习的方法取得了突破性的进步,在上采样,骨干网络,非极大值抑制, Anchor-based 方法等多个方面都取得了不错的成绩,但是仍然存在一些不足。如速度慢,推理时间长等问题。近年来随着人工智能的发展,对模型的要求也越来越高,希望能够有更好的方法提升模型性能,减少计算量,更好地适应多目标跟踪任务。因此RetinaNet便应运而生。 RetinaNet是Facebook AI Research团队于2017年提出的一种新型物体检测框架,其核心在于设计了一种新的损失函数来解决类别不平衡的问题,并通过引入anchor-free的方式来进行边框回归。如此一来,RetinaNet可以解决类别不平衡问题,并且可以获得更加精确的预测框。

一、相关背景介绍

(1)什么是物体检测

物体检测(Object Detection)是计算机视觉的一个子任务,它旨在从图像或视频中识别出感兴趣的目标对象及其位置。具体来说,就是在给定一张图像或是视频帧时,确定图像中是否有目标物体存在,并对这些物体的位置及类别作出预测。

(2)为什么要做物体检测?

在许多应用场景下,需要对图像或视频中的物体进行探测和跟踪。例如,城市环境监控系统、智能安防系统、工业自动化等都需要对视频中的车辆、行人、交通工具等进行检测和跟踪。另外,在搜索引擎、移动互联网、智能手机APP等平台上&#x

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/848122
推荐阅读
相关标签
  

闽ICP备14008679号