当前位置:   article > 正文

劲爆!YOLOv6又快又准的目标检测框架开源啦(附源代码下载)

yolov6部署开源地址

关注并星标

从此不迷路

计算机视觉研究院

79a0c7878bd38161f41ffdf369e2fad8.gif

880adc5db35aa3db1eb69403039ff5f0.gif

5a711366146e1542df3f8b416ce3f29b.png

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

20e0552d0278a65fceb9f21c351ae6e2.png

代码地址:https://github.com/meituan/YOLOv6

转自《美团技术团队》

计算机视觉研究院专栏

作者:Edison_G

近日,美团视觉智能部研发了一款致力于工业应用的目标检测框架YOLOv6,能够同时专注于检测的精度和推理效率。在研发过程中,视觉智能部不断进行了探索和优化,同时吸取借鉴了学术界和工业界的一些前沿进展和科研成果。在目标检测权威数据集COCO上的实验结果显示,YOLOv6在检测精度和速度方面均超越其他同体量的算法,同时支持多种不同平台的部署,极大简化工程部署时的适配工作。特此开源,希望能帮助到更多的同学。

01

概述

e2180d4058bfa54134ab1fd7c7943919.png

1fd3b5d50773ff31b777e1c7e8401573.png

图1-1 YOLOv6 各尺寸模型与其他模型性能对比

9870aabd94b273c6c16896ed6c6c05b8.png

图1-2 YOLOv6 与其他模型在不同分辨率下性能对比

ac0a7927ee53a8f8393edffbf6497ea8.png

02

Yolov6关键技术

c585ee7d90146f108e36b956fddce086.png

Hardware-friendly 的骨干网络设计

097ea77be7943e6e006b231a890c4005.png

90c1d60ed15e304135873ab8db9a7ab2.png

图2 Roofline Model 介绍图

50cc5047112da8912c775db7e448acfb.png

47f24cac4c9a4ac154ff0f93ef79613f.png

图3 Rep算子的融合过程[4]

5ae0456f85caa87dd947e8ce5fd5e2d1.png

16ba0f685a48b86493e0f488b438585b.png

图4 EfficientRep Backbone 结构图

6939106defcd9a54b2c1237956e7f4cb.png

c6b6093f40ecb848ae028fa0d2262912.png

图5 Rep-PAN 结构图

更简洁高效的 Decoupled Head

fb6389eb9dcf8f78bb3f60dca520825d.png

4927d6fb28dce190cf055f23ea59edbd.png

图6 Efficient Decoupled Head 结构图

更有效的训练策略

5f74150c032124dc87a92363a9734b06.png

cff6d930e242349b91b3e80cc0f6d31c.png

8e45f7df5eb5a77960311fdfe59127b6.png

03

实验结果及可视化

经过以上优化策略和改进,YOLOv6在多个不同尺寸下的模型均取得了卓越的表现。下表1展示了YOLOv6-nano的消融实验结果,从实验结果可以看出,我们自主设计的检测网络在精度和速度上都带来了很大的增益。

348482060b7a02ca6242c1a43ffc2001.png

表1 YOLOv6-nano 消融实验结果

下表2展示了YOLOv6与当前主流的其他YOLO系列算法相比较的实验结果。从表格中可以看到:

62b06effd696b0c3679916303f32c4f6.png

表2 YOLOv6各尺寸模型性能与其他模型的比较

fbe2f57d6ab10b7897a1f6232af4c2e9.png

04

总结与展望

6ccb08360506c7f2387dcbbaa54f93b8.png

05

参考文献

[1] YOLOv5, https://github.com/ultralytics/yolov5

[2] YOLOX: Exceeding YOLO Series in 2021, https://arxiv.org/abs/2107.08430

[3] PP-YOLOE: An evolved version of YOLO, https://arxiv.org/abs/2203.16250

[4] RepVGG: Making VGG-style ConvNets Great Again, https://arxiv.org/pdf/2101.03697

[5] CSPNet: A New Backbone that can Enhance Learning Capability of CNN, https://arxiv.org/abs/1911.11929

[6] Path aggregation network for instance segmentation, https://arxiv.org/abs/1803.01534

[7] OTA: Optimal Transport Assignment for Object Detection, https://arxiv.org/abs/2103.14259

[8] Computer Architecture: A Quantitative Approach

[9] SIoU Loss: More Powerful Learning for Bounding Box Regression, https://arxiv.org/abs/2205.12740


06

作者简介

楚怡、凯衡、亦非、程孟、秦皓、一鸣、红亮、林园等,均来自美团基础研发平台/视觉智能部。

© THE END 

转载请联系本公众号获得授权

6b457f939ad3dc82e0f931fe6473ca11.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

VX:2311123606

d0f481c6cb1d5c6bf3c24f4acc4f5817.png

往期推荐 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/698609
推荐阅读