赞
踩
(1)将输入图像resize 到;
(2)运行一个简单的卷积网络对输入图像进行处理;
(3)对模型输出confidence进行阈值处理得到检测结果;
相比较于其他实时系统,yolo可以实现大于两倍的平均精度.与其他采用话筒窗口获得区域的技术不同,yolo在训练,测试的时候,对整个图像进行处理,因此它可以获得物体的类别和外貌等信息.
检测网络有24个卷积层,卷积层之后是两个全连接层.并用1x1卷积层降低了来自以前的层的特征空间.预训练ImageNet分类任务的卷积层,训练数据为一半分辨率,即为224x224输入数据,之后再将图像high resolution为448x448的大小,作为输入数据,训练检测网络.
最后一层采用一个线性激活函数,其他层采用leaky rectified 线性激活函数,
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。