赞
踩
Yolo算法采用一个单独的CNN模型实现end-to-end的目标检测。本文将介绍一个端到端的方法——Yolo算法,该方法操作简便且仿真速度快,效果也不差。
Yolo算法是什么?
YOLO框架(You Only Look Once)与RCNN系列算法不一样,是以不同的方式处理对象检测。它将整个图像放在一个实例中,并预测这些框的边界框坐标和及所属类别概率。使用YOLO算法最大优的点是速度极快,每秒可处理45帧,也能够理解一般的对象表示。
Redmon 等人在 2015 年提出了 YOLO 算法,使得目标检测模型有了单阶段和双阶段之分。YOLO 去掉了候选框提取阶段,利用回归思想来处理目标检测通过卷积神经网络直接进行目标区域定位和目标类别的判断,网络具有更小的复杂度,拥有更快的检测时间,使得基于深度学习的目标检测模型开始能够满足实时性检测需求。
YOLO 首先将输入图像的分辨率调整为 448×448,然后将输入图片划分成 7×7个网格,每个网格只负责检测目标中心点落在该网格区域内的物体,每个网格预测2 个边界框。每个边界框包含 4 个坐标参数、1 个置信度参数和物体属于各个种类的概率。以 VOC 数据集包含的 20 类物体为例,YOLO 模型输出维度为 7×7×2×(5+20)的特征向量。
YOLO 与 GoogleNet 网络结构相似,其前 24 层为卷积层,在网络的第 2、4、9 和 20 层插入以最大池化实现的下采样层,最后连接两个全连接层。YOLO 网络结构如下图:
YOLO 检测模型结构简单且检测速度快,但是由于每个网格预测的边界框太少,当一个网格内出现的物体超过两个时,模型只能预测出 IOU 最高的物体,导致对小目标物体检测效果不好,容易发生漏检现象,而且 YOLO 模型尾部采用全连接层,导致模型的参数量多、计算量大。
免费分享一些我整理的人工智能学习资料给大家,包括一些AI常用框架实战视频、图像识别、OpenCV、计算机视觉、深度学习与神经网络等视频、课件源码、国内外知名精华资源、AI热门论文、行业报告等。
为了更好的系统学习AI,推荐大家收藏一份。
下面是部分截图,点击文末名片关注我的公众号【AI技术星球】发送暗号 321 领取(一定要发暗号 321)
一、人工智能课程及项目【含课件源码】
二、国内外知名精华资源
三、人工智能论文合集
四、人工智能行业报告
学好人工智能,要多看书,多动手,多实践,要想提高自己的水平,一定要学会沉下心来慢慢的系统学习,最终才能有所收获。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。