赞
踩
此次实战营的积分规则介绍:
笔记建议结合ppt来学习使用,ppt中对应知识可以参照笔记的标题进行查看。
ppt:lesson4_ppt
b站回放:OpenMMLab AI 实战营
往期笔记:笔记回顾
相关学习推荐:
同济子豪兄(大佬):子豪兄b站主页
OpenMMlab主页:OpenMMla主页
OpenMMlab Github仓库链接:Github OpenMMlab
MMDetection Github仓库链接:Github MMDetection
OpenMMlab 此次AI实战营的仓库:AI实战营github
与分类问题不同,目标检测的目标是在检测图像中物体类别的同时用矩形框框出所有感兴趣的物体。
例如:
目标检测的一些具体的下游任务,例如:
我们从下表所示的不同点与相同点的角度来比较图像分类与目标检测:
图像分类 | 目标检测 | |
---|---|---|
通常只有一个物体 | 物体数量不固定 | |
不同点 | 通常位于图像中央 | 物体位置不固定 |
通产占据主要面积 | 物体大小不固定 | |
相同点 | 需要算法“理解”图像的内容(即,深度神经网络实现) | 需要算法“理解”图像的内容(即,深度神经网络实现) |
也就是下图所示的,我们通过窗口获取图像中一个区域的内容,然后将该区域的图像传入一个例如卷积神经网络去预测里面是什么东西,下图所示的窗口中没有任何物体,所有返回类别**“背景”**。随着窗口的滑动,我们的预测类别会有所不同。
计算成本过于大,如下图所示:
这1200个窗口都需要分别放入神经网络中去进行前向预测,所以计算量非常大。
基于第二种改进的思路我们可以做这样的分析,如果两个窗口之间有重合的部分,能否设计一些算法使其避免计算重复部分。
思路:用卷积一次性计算所有特征,再取出对应位置的特征完成分类
解释:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。