深度学习在视觉方面的学习路线_视觉深度学习

作者：知新_RL | 2024-03-31 14:12:19

踩

视觉深度学习

很多人想学图像处理、视觉检测，因为这些年由于人工智能和深度学习的在视觉检测方面取得不错的应用，并且有的同学觉得深度学习在视觉方面更加容易发论文毕业。不论处于什么原因这里大致的给下本人学习视觉的路线，从开始的瞎捉摸怎么一步步慢慢摸索视觉检测之路。

一般的视觉分为基于传统视觉检测和深度学习视觉检测，就目前而言确实深度学习过于优秀几乎碾压传统视觉算法。但是一些特定场景下传统视觉还有它的用武之地，例如固定场景流水线还有检测镜头中有无变换等一些功能简单的场景。

本人在工作中就遇到过一个应用场景，甲方要求检测摄像头中一切可能出现的异物，就要发出报警。我们知道深度学习不论你用SSD，YOLO，还是现在大火的transform都需要样本进行训练，这种场景就很犯难，因为无法穷尽所有样本。一句话总结的就是，无固定特征样本场景的情况下深度学习很难处理，或者用深度学习成本很高。另外有在片载资源非常有限的硬件上深度学习算法比较吃力。因此传统还是深度学习没有一定，适合才是最好，要能融汇贯通才能发挥最强的剑招。

开始的时候我是从机器学习开始入手，以为机器学习就是深度学习。看到书上面满页的公式几乎崩溃，因为根本不知道这些符号如何能转换成酷炫的工程demo。

后面我也是在机缘巧合下，和一位入门很久大牛聊天，思路以下豁然开朗，首先需要读视觉领域一些综述性文章，这些论文能很好的把视觉的发展现状和未来分析出来，因此在多读了一些视觉综述后你会慢慢找到学习路径。

废话不多说直接上目标检测学习路线

骨干网络

颈部网络

头部推理

是的你没看错，就这3个但是这3个却包含很多网络结构变换，首先你听到的VGG、GoogLent、DenseNet等都是一种骨干网络结构，用于分类还是用于检测目标只是末端层的不同而已。

视觉和机械臂无人车等配合完成抓取或者跟踪的任务。先上一个demo视频，是利用深度学习检测积木，然后将坐标计算后发送给机械臂运动，若机械臂的臂展范围内不可达，需要移动AGV底盘。

WeChat_20220626103230-CSDN直播https://live.csdn.net/v/218971

本教程从头开始实现这一过程，受工作影响更新会有延迟。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/知新_RL/article/detail/344832