赞
踩
写在前面
在人工智能领域中,计算机视觉(Computer Vision, CV)被称为是人工智能时代的眼睛,具有广泛应用和巨大潜力。它为机器提供了对图像的高层次理解,以复制人类视觉能力为最终目标。2022年是计算机视觉的蓬勃发展之年,也是迄今以来计算机视觉的巅峰之年,出现了无数新科技(视觉Transformer、Pix2Seq)、新产品(Imagen、DALL-E2)、新模型(YOLOv7)。那么,对于计算机保研er来说,计算机视觉方向如何呢?今天岛主就来和大家一起聊聊这个热门话题,以及该如何准备计算机视觉保研。
01、计算机视觉介绍
什么是计算机视觉?
计算机视觉是使用计算机及相关设备对生物视觉的一种模拟,它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息。计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。作为一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等。
图源中国计算机学会官网(https://www.ccf.org.cn/Media_list/cncc/2021-10-08/745182.shtml)
02、计算机视觉有哪些研究方向?
图像分类
图像分类是根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。图像分类应用在许多领域,如医学成像、卫星图像中的目标识别、交通控制系统、刹车灯检测、机器视觉等。
目标检测
目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割。它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力,是计算机视觉的一个重要分支。目标检测多用于人脸识别、智慧交通(异常事件检测、交通流量监控与红绿灯配时控制)、工业检测等
目标跟踪
目标跟踪(Tracking-by-Detection)旨在跟踪一段视频中的目标的运动情况。它可以用来区分主体和背景之间的差异,并已成为首选的跟踪方法。目标跟踪目前广泛应用在体育赛事转播、安防监控和无人机、无人车、机器人等领域。
语义分割
语义分割是对图像中的每一个像素进行分类,目前广泛应用于医学图像与无人驾驶等。分割是计算机视觉的重要组成部分,它将整个图像划分为可以标记和分类的像素组。更具体地说,语义分割试图理解每个像素在给定图像中的作用。这一领域主要分为有监督语义分割、无监督语义分割、视频语义分割等。
······
计算机视觉应用案例
引用自图书:Computer vision: algorithms and applications
03、计算机视觉发展前景
国家政策大力支持
近年来,我国政府对计算机视觉行业给予了高度重视,并出台了多项政策支持其发展,为计算机视觉行业提供了良好的政策环境,促进其健康发展。
图源华经产业研究院官网
www.huaon.com
计算机视觉技术正处于发展的上半场,随着人脸识别性能、限定场景识别准确率等效果的不断提升,许多对象识别和分类问题将实现工业化,渗透到更多的行业应用中。国家政策已从多方向促进产业发展,督促企业在重视前沿算法研发的同时,加强算法与商业应用的融合,以提供更全面、及时的服务。未来,我国的医疗影像、智慧物流、工业制造、批发零售等创新应用领域也将进一步解锁,大力支持和引导中国人工智能的健康发展。
学术界多方向发展
近年来,计算机视觉领域的学术成果以爆发式增长,发展非常迅猛。计算机视觉顶会(CVPR、ICCV、ECCV等)每年都会收到大量的论文投稿,其中一些论文以出色的表现获得了大量的关注,例如GoogleNet VGG在不到8年的时间里就获得了10万次引用,而2015年的ResNet更是在更短的时间内获得了接近10万次的引用。虽然不少方向已经迈向技术成熟阶段,但仍有很多新的研究领域有待探索。
图源学术范官网
https://www.xueshufan.com/field/31972630?s=001001008001004
结合深度学习领域几大顶会以及产业界的需求,不难发现三维视觉、视频理解、多模态融合等技术慢慢成为新的研究趋势。更贴近现实场景的三维视觉技术,包括三维感知(点云获取及处理)、三维重建(大规模场景的三维重建、动态三维重建)、三维理解(三维物体的识别、检测及分割等)在近五年来得到快速发展。此外,随着5G时代的到来,视频数量呈爆炸式增长,视频的智能化理解成为亟待解决的问题。在计算机视觉愈发成熟后,多个传感器之间的相互保护和融合,也即多模态融合,也成为未来发展的机遇和挑战。
就业岗位和薪资
随着计算机视觉技术的不断进步,越来越多的企业开始采用计算机视觉技术,以提高生产效率,提升服务质量。据《2020年度中国计算机视觉人才调研报告》显示,在人工智能技术领域中,计算机视觉是中国市场规模最大的应用方向,占据了整个中国人工智能市场应用的34.9%。目前,最受欢迎的是算法工程师岗,有算法的实际产品化及视频分析经验的人才大受欢迎。除算法工程师外,计算机视觉与AI产业催生的AI产品经理、AI算法测试工程师、AI售前解决方案工程师等成为企业急需人才。此外,研究院、高校、政府机构也在吸纳计算机视觉领域人才。
图源澎湃新闻网
https://m.thepaper.cn/baijiahao_11433021
04、计算机视觉保研准备
背景知识
扎实的基础知识是我们在保研笔试、面试中的最大底气,那么对于想要保研该方向的同学来说需要加强哪些方面的知识呢?岛主为大家总结为以下三大方面:
图像处理,大致包括的内容:光学成像基础、颜色、滤波器、局部图像特征、图像纹理、图像配对等。
立体视觉,大致包括的内容:相机几何模型、双目视觉、从运动中恢复物体结构、三维重建技术等。
人工智能,大致包括的内容:场景理解与分析、模式识别、图像搜索、数据挖掘、深度学习等。
05、学习平台介绍
工欲善其事,必先利其器。人工智能(尤其是算法)的实现需要强大的计算能力的支撑,特别是深度学习算法的大规模使用,对计算能力提出了更高的要求。计算机视觉由于针对图像、视频,更需要算力较强的计算机来运行。在学习中个人的计算机配置可能难以达到令人满意的要求,或是由于配置不够导致计算较慢,效率较低。但幸运的是,国内外多家企业和团体提供了AI平台开源服务,使得我们可以利用免费高效的在线云计算编程环境,甚至白嫖一些公开的数据集和常用代码。下面岛主就给大家介绍一些好用的线上平台。
百度AI Studio
百度AI Studio是一个面向AI学习者的在线一体化学习与实训社区,它汇集了多种AI教程、深度学习样例工程、各领域的经典数据集、云端的超强运算及存储资源,以及比赛平台和社区,旨在解决学习者在AI学习过程中遇到的诸多问题,如教程水平不一、教程和样例代码难以衔接、高质量的数据集不易获得,以及本地难以使用大体量数据集进行模型训练等。
阿里云人工智能平台
自2009年创立以来,阿里云一直是全球领先的云计算及人工智能科技公司,致力于通过在线公共服务的方式,为用户提供安全、可靠的计算和数据处理能力。阿里云平台整合资源涉及自然语言处理、智能语音、视觉计算等多个热门领域。
华为云AI平台
华为的AI平台建立在华为云的基础上,它依托华为的硬件,特别强调面向开发者的服务。Model Arts是华为云的AI一站式开发平台,可以支持开发者完成从数据到AI应用的全流程开发,包括数据处理、模型训练、模型管理和部署等操作。
Kaggle
Kaggle是一个数据建模和数据分析竞赛平台,企业和研究者可在其上发布数据和问题,吸引各界人士在平台上竞赛以产生最好的解决模型。如果提交的结果符合指标要求并且在参赛者中排名第一,可以获得比赛丰厚的奖金。对于初学者而言,Kaggle每周提供的30h的GPU免费使用权也是非常有诱惑力的,这意味着我们可以在Kaggle平台上运行自己的深度学习代码。
06、招生学校/实验室推荐
北京大学智能学院信息科学中心
北大智能学院成立时间较短,但师资力量雄厚(院士1人,“长江学者”2人,杰青2人,优青2人),且学校title也很好。它属于弱com,导师具有很大话语权,所以一定要提前联系导师,通过导师的考核基本就能拿到offer。
中科院自动化研究所模式识别国重
该实验室历史较久(1987年),实力在国内数一数二,拥有众多大牛导师。属于强com,需要通过面试考核拿到优营(60%比例),直博和学硕的招生人数都很多,值得推荐。
中科大智能信息处理重点实验室
该实验室成果丰富,在国内也很有名气,属于报名火爆的院校。是强com院校,需要经历几轮测试(笔试,机试and面试),根据最终成绩录取。大部分是学硕,直博很少。
07、相关Q&A
Q1
哪些专业的同学适合这个方向?
岛主通过对近年来各高校、研究所老师的招生要求分析,发现数学、计算机科学与技术、软件工程、自动化等专业的学生都比较受该专业青睐,有计算机视觉、深度学习、计算机图形学、人工智能等课程或者科研项目经历者能够被优先考虑。此外,良好的数理基础、快速迭代实现的编程能力、机器学习的基本知识和较好的英文阅读和写作能力都是老师们格外看重的能力。
上海交通大学叶南阳助理教授招生条件可供参考(https://ynysjtu.github.io/)
Q2、电信/自动化同学能否跨保?
答案是肯定的。作为一个交叉性较强的前沿专业,计算机视觉欢迎各种专业背景的同学们加入,可以说跨保门槛较低。目前大多数理工科专业都会学习一些基本的数理和计算机技术,这为我们学习计算机视觉打下了良好的基础。计算机视觉专业在招生上比较包容,因此各专业的同学在跨保时一定要对自己有信心!
Q3、计算机视觉看重专业还是学校title?
作为一个新兴的研究方向,为它专门开设一门专业的院校其实并不是特别多,更多情况下是纳入计算机应用技术专业招生,或者从事该方向的老师发布具有针对性的招生要求。因此,可以根据自己的实际情况来判断到底是专业还是学校title更重要。如果已经下定决心致力于计算机视觉领域,那么选择实力强、具有权威性、走在前沿的导师组或者院校是很有帮助的。这会使得你在读研期间有丰富的经费和资源支持、专业性极强的指导,从而获得更快速的成长、更广阔的发展空间。如果你还并未下定决心,只是在没有明确目标的情况下想尝试这个方向,那么综合实力更强、排名更前的学校可能更适合你。即使以后想改换专业,也能有更多的退路。
The end
写在最后
岛主对计算机视觉领域详细的介绍和解读有没有帮助到你呢?祝愿每个计算机保研er都能找到自己心仪的道路~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。