赞
踩
1.设定类别数,设定图片划分为多少个网格,每个网格预测出来几个边框。原文是20个类别,并将图片划分为7*7网格,每个网格预测出2个边框。
2.将图片缩放到448*448,然后输入到CNN网络(卷积、池化、两个全连接),然后输出的就是7*7*30的tensor(20个对象分类的概率、2个bounding box的位置(2*4=8)、2个bounding box的置信度),通过处理输出box_confidence box_xy box_wh box_class_probs。即在图片上可得到边界框7*7*2=98.
3.设定阈值过滤边框。
4.进行非极大值抑制(NMS).
5.将最后输出列表里的边界框显示在图片,并显示分数和所属类别。
每个边界框的中心点坐标均为相对于其对应的cell左上点坐标的偏移,此时即保证每个边界框的中心点均落在其对应的cell中。其计算公式如下:
上式中:
参考链接
https://www.jianshu.com/p/cad68ca85e27
https://www.jianshu.com/p/d452b5615850
https://blog.csdn.net/yzy__zju/article/details/98039103
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。