赞
踩
计算机视觉常用技术:
图像处理能力赋予了计算机看即获取的能力,是人工智能的重要输入。
图像描述是图像理解的前提,其作用是挖掘一般或主要信息去描述图像。
模式识别、机器学习、深度学习等算法赋予计算机看懂的能力,是人工智能的核心,更形象的说就是让计算机像人的大脑去理解图像。
图像处理常用技术:
本文重点介绍计算机视觉任务的三大应用,分别是图像识别、目标检测和图像分割。
图像识别又叫图像分类,就是输入一张图片,输出该图像的类别,让计算机识别人、交通信号灯、动物等这些信息,这是广义上的图像识别。在工业界和学术界还有针对特定目标的识别,比如车牌识别,在高速公路的ETC口,不需要人工收费,摄像头会识别你的车牌并收取相应的费用。另外人脸识别在日常生活中也得到了广泛的应用,如支付宝的人脸支付等。
目标检测是计算机视觉任务中另一个常见的应用,其目的是输出给定图像中特定目标的位置,类别等。由此可见,目标检测是对目标识别的进一步发展,计算机不仅要输出图像中目标的位置,还要给出目标的类别。目标检测一个常见的应用是行人检测,比如在一个交通路口,快速地检测出摄像头中拍到的所有行人,可以估计人流数,从而对异常事件进行预警。
目标分割是与计算机视觉任务相关的第三个任务,图像分割又可分为图像语义分割和个体分割。图像语义分割是将图像分割成一个个独立的个体,每个个体具有一定的语义意义。图像个体分割是比图像语义分割更进一步的任务,其是图像语义分割和图像检测的结合,即不仅要独立出所有的物体,还要输出所有物体的位置。图像分割是计算机解释图像的过程,这类似于人理解图像,就需要找出图像中一个个的物体,找出物体之间的关系等。
未来计算机视觉任务发展面临的挑战主要来自三个方面:
图像处理是用计算机对图像进行分析,以达到所需结果的技术。
计算机视觉是让计算机获取图像到看懂图像的过程。更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
图像处理技术一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。
计算机视觉技术包括图像获取、预处理、特征提取、检测分割、高级处理。
图像处理应用于:摄影及印刷、卫星图像处理、医学图像处理、面孔识别,特征识别、显微图像处理、汽车障碍识别
计算机视觉应用于:视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。
长期以来,让计算机能看会听可以说是计算机科学家孜孜不倦的追求目标,这个目标中最基础的就是让计算机能够看见这个世界,让计算机能够像人类一样拥有眼睛,让它们也能看懂这个世界。
应用深度学习解决计算机视觉的问题
“带有卷积结构的深度神经网络(CNN)”被大量应用于计算机视觉之中。这是一种仿照生物视觉的逐层分解算法,分配不同的层级对图像进行处理。 卷积是两个函数之间的相互关系,然后得出一个新的值,他是在连续空间做积分计算,然后在离散空间内求和的过程。实际上在计算机视觉里面,可以把卷积当做一个抽象的过程,就是把小区域内的信息统计抽象出来。
CNN,特别是其基本原理与算法被视为计算机视觉的首选解决方案,深度学习应用于计算机视觉上还有更多优点:
深度学习算法的通用性很强,在传统算法里面,针对不同的物体需要定制不同的算法。相比来看,基于深度学习的算法更加通用,比如在传统CNN基础上发展起来的faster RCNN,在人脸、行人、一般物体检测任务上都可以取得非常好的效果。
深度学习获得的特征(feature)有很强的迁移能力。所谓特征迁移能力,指的是在A任务上学习到的一些特征,在B任务上使用也可以获得非常好的效果。
工程开发、优化、维护成本低。深度学习计算主要是卷积和矩阵乘法,针对这种计算优化,所有深度学习算法都可以提升性能。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。