赞
踩
特征提取–> 分类/定位回归。
通过CNN卷积网络卷积出图片特征,直接使用回归网络回归出类别的概率和位置坐标值
one stage 现在的代表为 yolo ssd
特征提取 --> 生成RP --> 分类/定位回归。
先进行区域生成,即生成候选区域(Region Proposal),在通过卷积神经网络预测目标的分类与定位
先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类。
首先输入一张图片,接着经过卷积神经网络,通过卷积神经网络对图片进行深度特征的提取,这个卷积神经网络称之为主干网络(典型的主干网络有VGGNet、ResNet 、Zenet等一些经典的卷积神经网络结构);接着通过RPN网络来进行候选区域产生的操作,同时也会完成区域的分类,即将图片分为背景和目标这样两种的不同的类别,并且也会对目标的位置进行初步的预测。
接下来对候选区域中的位置进行精确定位和修正,使用Roi_pooling层,可以将此层理解为抠图的操作,接着将抠图所得到的候选目标对应到特征图(feature map)上相应的特征区域,然后经过一个全连接层(fc),并得到相应的特征向量,最后通过分类和回归这样两个分支,来实现对这个候选目标类别的判定和目标位置的确定(也就是最后矩形框的四个点的坐标,(x,y,w,h):(x,y)为左上角顶点的坐标,w,h是矩形框的长和宽)
two stage 的主要应用为 faster rcnn
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。