赞
踩
DPM算法采用了改进后的HOG特征,SVM分类器和滑动窗口(Sliding Windows)检测思想,针对目标的多视角问题,采用了多组件(Component)的策略,针对目标本身的形变问题,采用了基于图结构(Pictorial Structure)的部件模型策略。此外,将样本的所属的模型类别,部件模型的位置等作为潜变量(Latent Variable),采用多示例学习(Multiple-instance Learning)来自动确定。
平均精度均值(mAP)是预测目标位置以及类别的这一类算法的性能度量标准。mAP 对于评估目标定位模型、目标检测模型以及实例分割模型非常有用。
在模型预测时,输出的 bounding box 是有很多的,但是大部分都是置信度很小的,我们只需要输出置信度超过某个阈值的 bounding box 。
TP —— True Positive (真正, TP)是指某(些)个正样本被预测判定为正;此种情况可以称作判断为真的正确情况【correctly identified】。
TN —— True Negative(真负 , TN)是指某(些)个负样本被预测判定为负;此种情况可以称作判断为假的正确情况【correctly rejected】。
FP ——False Positive (假正, FP)是指某(些)个负样本被模型预测为正;此种情况可以称作判断为真的错误情况,或称为误报【incorrectly identified】。
FN——False Negative(假负 , FN)是指某(些)个正样本被模型预测为负;此种情况可以称作判断为假的错误情况,或称为漏报【incorrectly rejected】。
准确率和召回率是互相影响的,因为如果想要提高准确率就会把预测的置信率阈值调高,所有置信率较高的预测才会被显示出来,而那一些正确正预测(True Positive)可能因为置信率比较低而没有被显示了。一般情况下准确率高、召回率就低,召回率低、准确率高,如果两者都低,就是网络出问题了。
一般来说影响 mAP 的原因有很多,主要有以下几个:
1. 不好的训练数据。
2. 训练数据不够多。
3. 标注的框不准确。
4. 数据的多变性。
有的时候增加训练数据可能 mAP 并不会增加多少。当然了,使用表现更好的网络,其 mAP 自然地也会更加的高。
IoU 的全称为交并比(Intersection over Union)。IoU 计算的是 “预测的边框” 和 “真实的边框” 的交集和并集的比值。
dropout layer的目的是为了防止CNN 过拟合, 在训练过程中,将神经网络进行采样,也就是随机的让神经元激活值为0,而在测试时不再采用dropout。通常设置随机采样概率为0.5,也可以通过验证集来确定采样概率。
1.**前向传播**
训练阶段:前向传播给定每个神经元一个随机值(0~1),假定设置采样阈值为0.5,如果该神经元对应的随机值小于0.5,则设置该神经元为0,否则设置该神经元值为2乘以原值,(1/0.5),并把所有神经元对应的随机值保存下来,在后向传播是需要使用。
测试阶段:无需dropout。
2.**反向传播**
读取在前向传播记录的随机值,同样的操作:该梯度值对应的随机值小于0.5,则设置该梯度值为0,否则设置该梯度值为2乘以原值,(1/0.5)。
非极大值抑制,简称为NMS算法,英文为Non-Maximum Suppression。其思想是搜素局部最大值,抑制极大值。
目标检测的过程中在同一目标的位置上会产生大量的候选框,这些候选框相互之间可能会有重叠,此时我们需要利用非极大值抑制找到最佳的目标边界框,消除冗余的边界框。
左图是人脸检测的候选框结果,每个边界框有一个置信度得分(confidence score),如果不使用非极大值抑制,就会有多个候选框出现。右图是使用非极大值抑制之后的结果,符合我们人脸检测的预期结果。
前提:目标边界框列表及其对应的置信度得分列表,设定阈值,阈值用来删除重叠较大的边界框。 IoU:intersection-over-union,即两个边界框的交集部分除以它们的并集。
非极大值抑制的流程如下:
· 根据置信度得分进行排序
· 选择置信度最高的边界框添加到最终输出列表中,将其从边界框列表中删除
· 计算所有边界框的面积
· 计算置信度最高的边界框与其它候选框的IoU
· 删除IoU大于阈值的边界框
· 重复上述过程,直至边界框列表为空。
FPS(frame per second)是图像领域中的定义,是指画面每秒传输帧数,通俗来讲就是指动画或视频的画面数。FPS是测量用于保存、显示动态视频的信息数量。每秒钟帧数愈多,所显示的动作就会愈流畅。通常,要避免动作不流畅的最低是30。
假设在一个单类别检测问题中的样本有两类(背景算1类)。Background false positive就是把background错误检测为正样本框 的数量。
ROI(region of interest),感兴趣区域。机器视觉、图像处理中,从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域,称为感兴趣区域,ROI。
在图像处理领域,感兴趣区域(ROI) 是从图像中选择的一个图像区域,这个区域是你的图像分析所关注的重点。圈定该区域以便进行进一步处理。使用ROI圈定你想读的目标,可以减少处理时间,增加精度。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。