当前位置: article > 正文

小米平板6 Max-Yolo：在便携终端上实时检测不再是难题

作者：2023面试高手 | 2024-04-18 16:42:52

踩

计算机视觉研究院专栏

作者：Edison_G

目标检测是现在最热门的研究课题，目前最流行的还是Yolo系列框架，最近我们计算机视觉研究院也分享了很对目标检测干活及实践，都是Yolo-Base框架，今天我们分享一个经过修改后的Yolov5，在小米Pad上实时检测！

公众号ID｜ComputerVisionGzq

学习群｜扫码在主页获取加入方式

开源代码：https://github.com/ultralytics/yolov5/releases

前言&背景

目标检测是现在最热门的研究课题，现在的框架越来越多，但是技术的新颖性到了瓶颈，目前开始流行Transformer机制，而且在目标检测领域也能获得较大的提升，也是目前研究的一个热点。

（国足在世预赛首阶段36强分组对手敲定，中国队跟韩国和泰国两支亚洲劲旅分到了一组）

目前最流行的还是Yolo系列框架，最近我们“计算机视觉研究院”也分享了很对目标检测干活及实践，都是Yolo-Base框架。

新框架改进

今天我们分享一个经过简单优化过的Yolov5，暂时命名为：Pad-YoloV5，在IPad上可以实时检测！基于YoloV5框架，熟悉的同学应该都不用多加解释。

YoloV4在YoloV3的基础上增加了近两年的研究成果，如下：

输入端采用mosaic数据增强
Backbone上采用了CSPDarknet53、Mish激活函数、Dropblock等方式。（cspnet减少了计算量的同时可以保证准确率）
Mish函数为：
Neck中采用了SPP、FPN+PAN的结构，
输出端则采用CIOU_Loss、DIOU_nms操作

YoloV5主要的改变，如下：

输入端：Mosaic数据增强、自适应锚框计算
Backbone：Focus结构，CSP结构
Neck：FPN+PAN结构
Prediction：GIOU_Loss

正好会看雷军的演讲，就随手测试下效果

这次主要优化，是YoloV5在数据增强的时候，用随机缩放、随机裁剪、随机排布的方式进行拼接，这个对于小目标的检测效果还是很友好的。通过实验发现，这个随机拼接和有规律的拼接，最终的结果还是有一点差别的。

首先我通过修改数据增强的策略，开始对整体数据集进行统计（也就是数据预处理分析），我大致分成三个范围。将最大的与最小的进行随机拼接，最终结果确实比整体随机的效果好！

其次，稍微修改了下自适应图片缩放策略，Yolov5代码中datasets.py的letterbox函数中进行了修改，对原始图像自适应的添加最少的黑边。我是在自适应缩放后的图片，我在右下角位置填边，其实大多数数据没有什么变化，只是随便改改，因为在线都是在Yolo的基础上增加最近几年新出的策略，确实在最后的检查有一定效果的增加。

由于训练了5个epoch，效果在pad上测试不够理想

最后的修改，就是辛苦的把Transformer机制加进了YoloV5的基础框架中，训练确实加快了，但是对于用笔记本训练的成果物，还是不够明显。这也是最近第一次分享实践过程的一些小心思，具体的细节我们“计算机视觉研究院”后期会通过一篇干活详细和大家分享！

© THE END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

往期推荐

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/2023面试高手/article/detail/447050

推荐阅读

相关标签