赞
踩
v1训练使用的是224224的 测试时使用了448448
1.输入图像 4484483(大小不能变,因为有全连接层)
2. conv 得到特征图 771024 (GoogleNet)
3.全连接 40961
4.全连接 14701
5. reshape一下 7730
获得7*7个格子,每个格子中有30个值
因为 有两个经验框 (其他模型没必要那么细) 每个框 x1/x2 y1/y2 w1/w2 h1/h2 置
信度(x,y 都是一个相应的位置,不是他的具体位置 ,归一化过后的)
两个框5+5 +20个类别
20类别 =狗的概率 | 猫的概率 | …
1.先计算位置的误差 x y的
w h加根号的原因就是 解决小物体中 偏移量小时原来可能不明显,(但是加了之后稍微改进一点。) 数值较小时 数据敏感 数据较大的时候不太敏感。
2.置信度的损失计算
首先就是计算IOU,预测的框和标定的框 >0.5时就说他包含目标
一个真实框可能有很多候选框,只选择IOU信息大的
小于这个IOU的阈值就说你为背景,就计算你不包含目标置信度的损失。
包含目标的置信度损失+不包含目标的置信度损失
1.每个cell 只能预测一个类别,重合在一起的东西 很难分出来,多标签也不行 。
2.小物体检测不到 ,因为只有两个预测框(长宽比比较单一) 只能检测比较大的
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。