当前位置:   article > 正文

YOLOV1-理论笔记_yolov1输入为灰度图

yolov1输入为灰度图

V1

v1训练使用的是224224的 测试时使用了448448

流程:

1.输入图像 4484483(大小不能变,因为有全连接层
2. conv 得到特征图 771024 (GoogleNet)
3.全连接 40961
4.全连接 1470
1
5. reshape一下 7730
获得7*7个格子,每个格子中有30个值
因为 有两个经验框 (其他模型没必要那么细) 每个框 x1/x2 y1/y2 w1/w2 h1/h2 置
信度(x,y 都是一个相应的位置,不是他的具体位置 ,归一化过后的)
两个框5+5 +20个类别
20类别 =狗的概率 | 猫的概率 | …
在这里插入图片描述

在这里插入图片描述

损失函数:

1.先计算位置的误差 x y的
w h加根号的原因就是 解决小物体中 偏移量小时原来可能不明显,(但是加了之后稍微改进一点。) 数值较小时 数据敏感 数据较大的时候不太敏感。

2.置信度的损失计算

首先就是计算IOU,预测的框和标定的框 >0.5时就说他包含目标
一个真实框可能有很多候选框,只选择IOU信息大的
小于这个IOU的阈值就说你为背景,就计算你不包含目标置信度的损失。

包含目标的置信度损失+不包含目标的置信度损失
在这里插入图片描述

问题所在:

1.每个cell 只能预测一个类别,重合在一起的东西 很难分出来,多标签也不行 。
2.小物体检测不到 ,因为只有两个预测框(长宽比比较单一) 只能检测比较大的

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/292261?site
推荐阅读
相关标签
  

闽ICP备14008679号