计算机视觉应该怎样入门？_计算机视觉:模型、学习和推理 pdf

作者：Guff_9hys | 2024-06-23 17:38:20

踩

计算机视觉:模型、学习和推理 pdf

作者：量子位
链接：https://www.zhihu.com/question/23902574/answer/922634999
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

这里有一本长达81页的CV成长指南，能给萌新无微不至的关怀：

从装Python、装OpenCV、入门深度学习，到人脸识别、目标检测、语义分割等等各种应用，都有进阶路线，里面包含了教程、案例、注意事项。甚至怎样把算法部署到树莓派之类的硬件上，也能找到经验。

推特发出12小时，已经有1200人点了赞。作者名叫Adrian Rosebrock，是个经常出产教程的宝藏男子。

萌新的你，想要成长为一名合格的老司机，请马克这份指南。

然后，来看里面的内容到底有多丰富：

事无巨细

为了避免“从入门到放弃”的惨剧，在你成为老司机的路上，这份指南给每一步都做了安排。

从目录看，大致分为两部分，左边一列是基础，右边一列是应用：

先看左边的基础装备：

· 应该从哪开始呢
· 深度学习
· 人脸应用
· 图像文字识别 (OCR)
· 目标检测
· 目标追踪
· 实例分割和语义分割

第一章“应该从哪开始呢”，是OpenCV的进阶路线：

一是安装Python和OpenCV (初) ，二是理解命令行arguments (初) ，三是用示例学OpenCV (初) ，四是自己搭个OpenCV小项目 (初) ，五是做更高级的OpenCV项目 (中) ，六是在CV的大世界里，选择自己的小方向 (中) 。

每一步都有需要注意的事项，还有必要的教程资源。

比如，怎样安装OpenCV最简单，为什么不要用Windows，做项目的过程中有哪些常见错误类型要避免。

有些步骤，还会分成多个小步骤，每个小步又有作者的温馨建议。比如，这是第五步：

当这个章节的六步完成之后，还有一步叫“What to Next”，除了告诉大家下面应该做什么，也有一些额外的教程资源提供。

第二章“深度学习”，是算法的进阶路线，内容比第一章更丰盛，有12步：

一是构建深度学习环境 (初) ，二是训练自己的第一个网络 (初) ，三是理解CNN (初) ，四是搭个自己的图像数据集 (中) ，五是在自己的数据集上训练一个CNN (中) ，六是调整学习率 (中) ，七是数据扩增 (中) ，八是特征提取和微调预训练网络 (中) ，九是视频分类 (高) ，十是多输入和多输出网络 (高) ，十一是改进自己的网络 (高) ，十二是AutoML和AutoKeras。

依然，每一步都提供了详细的指引，有过往成功案例为你保驾。比如，这是第十二步：

从第三章“人脸应用”开始，就是在各种具体任务当中用到的算法了。

检测人脸，检测关键点，识别人脸，提升算法的准确率……也把前两章的进阶路线，贯彻进了任务里。

在这一章，作者Adrian Rosebrock频繁出镜：

第四章-第七章，文字识别、目标检测、目标追踪、实例分割和语义分割，与第三章同理，此处便不详述。

作者继续高密度出镜：

接下来看右边一列，是帮你走进现实的：

· 嵌入的和物联网用的CV
· 树莓派上的CV
· 医学领域的CV
· 搞搞视频
· 图片搜索引擎
· 大神采访，案例研究 (与教程) ，成功故事

比如，怎样把自己的算法，放进树莓派里，放进冰箱里，放进脑子里，都有详尽的玩法。

作者依然在出镜：

除此之外，还有各种成功前辈的采访，里面有一些成功案例 (或附带教程) ，是初学者可以借鉴的经验：

除了技术上的建议，这些资料也可当做美味的鸡汤，鼓舞着你一路走向人参巅峰。

传送门

万事俱备，大家可以开始修炼了。

顺便回答一下这个问题：作者说的81页，这个数到底是怎么来的。

Start Here with Computer Vision, Deep Learning, and OpenCV - PyImageSearchwww.pyimagesearch.com

— 完 —

====================================

作者：MurphyWan
链接：https://www.zhihu.com/question/23902574/answer/269793453
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

自学了一段时间计算机视觉(Computer Vision)，下文简称：CV。内容以基本概念为主，形式以看书为主，跟着敲代码为辅。

起因：因工作中会涉及到交通物流风险管理、出险理赔材料审查等内容，会涉及到大量人工介入审阅照片、视频的环节。而随着素材量的增加将来需要大量的人力来处理，导致成本高，效率低、易出错。
思考：能否通过某种技术进行照片、视频内容的审查，从而消化一定的工作量，同时提升效率？带着这样的问题，我们锁定了CV技术。