当前位置:   article > 正文

VoVNet、VarGNet、PeleeNet:轻量级实时网络(嵌入端)

vovnet wma

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者丨Tom Hardy@知乎

来源丨https://zhuanlan.zhihu.com/p/317399539

编辑丨3D视觉工坊

最近看了些基于移动端、嵌入端的轻量级深度学习网络,一起来分享下~

一、VOVNet

一种专注GPU计算、能耗高效的网络结构。

论文:An Energy and GPU-Computation Efficient Backbone Network for Real-Time Object Detection

链接:https://arxiv.org/pdf/1904.09730v1.pdf

文章的主要思想其实是One-Shot Aggregation模块,如下图所示,文章对标DenseNet,论文指出DenseNet的一些缺点:dense connection 所有中间层的密集连接导致不可避免的低效率,这是由于每层的输入通道大小随着层的推进而线性增加。由于dense connection,DenseNet 在FLOPs或者参数约束下只能产生少量的特征。换句话说,DenseNet通过dense连接将特征的数量与特征的质量进行权衡。虽然Densenet的表现似乎证明了这种贸易是有益的,但从能源和时间的角度来看,这种贸易还有一些其他的缺点。所以论文引入了One-Shot Aggregation来改进Dense Block。

论文的实验显示,在FLOPs和参数大小相同的情况下,VoVNet效率更高,在coco上的检测性能也略超越DenseNet。

二、VOVNet2

这是对VoVNet的改进,出自论文CenterMask : Real-Time Anchor-Free Instance Segmentation(https://arxiv.org/pdf/1911.06667.pdf),就是下图的最右边这个东东。。。

VoVNetV2引入了ResNet的残差连接和SENet的SE模块。

来看下速度和精度,COCO数据集:

相比于V1,AP还算很明显了,速度上也没很大劣势,无痛啊。。。

三、VarGNet

论文:VarGNet: Variable Group Convolutional Neural Network for Efficient Embedded Computing

链接:https://arxiv.org/pdf/1907.05653v1.pdf

地平线2019年新提出的一种轻量级网络,适用嵌入式系统的计算,地平线的芯片上也已经支持了~

论文指出,如果网络中操作的计算强度更平衡,则网络计算图更容易优化。因此提出了基于深度可分离卷积的可变组卷积。在可变组卷积中,每个组的输入通道数是固定的,可以作为超参数进行调整,这与组卷积中组数是固定的是不同的。这样做的好处有两方面:从编译器的角度来看,固定通道的数量更适合于优化,因为它具有更一致的计算模式和数据布局; 除此之外,可变组卷积具有更大的网络容量,从而允许更小的信道号,这有助于减轻片外通信的时间消耗。

四、PeleeNet

论文:Pelee: A Real-Time Object Detection System on Mobile Devices

链接:arxiv.org/pdf/1804.0688

Dense Layer的改进,这里不再详细阐述,可以看下图~

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/127857
推荐阅读
相关标签
  

闽ICP备14008679号