赞
踩
点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
作者丨Tom Hardy@知乎
来源丨https://zhuanlan.zhihu.com/p/317399539
编辑丨3D视觉工坊
最近看了些基于移动端、嵌入端的轻量级深度学习网络,一起来分享下~
一种专注GPU计算、能耗高效的网络结构。
论文:An Energy and GPU-Computation Efficient Backbone Network for Real-Time Object Detection
链接:https://arxiv.org/pdf/1904.09730v1.pdf
文章的主要思想其实是One-Shot Aggregation模块,如下图所示,文章对标DenseNet,论文指出DenseNet的一些缺点:dense connection 所有中间层的密集连接导致不可避免的低效率,这是由于每层的输入通道大小随着层的推进而线性增加。由于dense connection,DenseNet 在FLOPs或者参数约束下只能产生少量的特征。换句话说,DenseNet通过dense连接将特征的数量与特征的质量进行权衡。虽然Densenet的表现似乎证明了这种贸易是有益的,但从能源和时间的角度来看,这种贸易还有一些其他的缺点。所以论文引入了One-Shot Aggregation来改进Dense Block。
论文的实验显示,在FLOPs和参数大小相同的情况下,VoVNet效率更高,在coco上的检测性能也略超越DenseNet。
这是对VoVNet的改进,出自论文CenterMask : Real-Time Anchor-Free Instance Segmentation(https://arxiv.org/pdf/1911.06667.pdf),就是下图的最右边这个东东。。。
VoVNetV2引入了ResNet的残差连接和SENet的SE模块。
来看下速度和精度,COCO数据集:
相比于V1,AP还算很明显了,速度上也没很大劣势,无痛啊。。。
论文:VarGNet: Variable Group Convolutional Neural Network for Efficient Embedded Computing
链接:https://arxiv.org/pdf/1907.05653v1.pdf
地平线2019年新提出的一种轻量级网络,适用嵌入式系统的计算,地平线的芯片上也已经支持了~
论文指出,如果网络中操作的计算强度更平衡,则网络计算图更容易优化。因此提出了基于深度可分离卷积的可变组卷积。在可变组卷积中,每个组的输入通道数是固定的,可以作为超参数进行调整,这与组卷积中组数是固定的是不同的。这样做的好处有两方面:从编译器的角度来看,固定通道的数量更适合于优化,因为它具有更一致的计算模式和数据布局; 除此之外,可变组卷积具有更大的网络容量,从而允许更小的信道号,这有助于减轻片外通信的时间消耗。
论文:Pelee: A Real-Time Object Detection System on Mobile Devices
链接:arxiv.org/pdf/1804.0688
Dense Layer的改进,这里不再详细阐述,可以看下图~
本文仅做学术分享,如有侵权,请联系删文。
下载1
在「3D视觉工坊」公众号后台回复:3D视觉,即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。
下载2
在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总,即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。
下载3
在「3D视觉工坊」公众号后台回复:相机标定,即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配,即可下载独家立体匹配学习课件与视频网址。
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。