赞
踩
计算机视觉,即让计算机去模拟人类的视觉系统,来获取并理解图像中的信息。
现在世界上每天产生的数据70%都是以图像或视频的形式呈现,同时世界上的摄像头数量已经过亿,每天存储的视频时长超过了8亿小时。但是,被有效利用的图像、视频数据仍不到20%。
随着深度学习的发展,虽然数据被利用的程度越来越高,以往处理图像的手段得到了升级,但是计算也开始变得更加复杂,这也决定了“当下的发展”始终被限定在语义鸿沟之中。
因为生物获取视觉信息的推理过程更为简单、高级,计算机视觉的推理进化仍需要走很长的一段路。
回到正题,这一节先对计算机视觉的几个主要任务进行认知。
确定是否有目标存在、目标在什么位置以及其包含的关键点坐标,如人脸关键点检测、人体关键点检测:
对生物、物体、文字符号进行类别判定后映射到一个标签,如图像分类、视频分类:
分割任务主要分为实例分割和语义分割,实例分割是物体检测加上语义分割的综合体;
语义分割,是将图像像素,根据其表达的含义的不同进行分组/分割:
人脸识别是当下计算机视觉中应用最热门的一门技术,其执行了检测定位、识别这几个关键任务来达到对人脸的高效辨认,解决了几个关键的问题 :
如信任——手机相信了你是主人后让你解锁、关卡相信了你是具有许可的人后让你过关、银行系统相信了你是诚信用户后…
定位——摄像机看到你之后告诉监控系统你在哪…
所以接下来,我将尽量对所有涉及到的概念进行比较详细的描述,通过在了解人脸识别技术点的过程中更好的去理解计算机视觉概念之间的联系。
人脸识别技术即计算机通过对采集到的包含人脸的数据进行处理之后,达到分类的目的。
首先,人脸识别的“发展趋势”亦是朝着“智能化”——推理、“人性化”——理解,的方向发展的,而现在的“瓶颈”也正是因为人脸识别对于人脸的推理能力不足导致的——特征依赖程度高。
回顾之前“瓶颈”的概念瓶颈”是促成“当下的发展”的因素,而“当下的发展”即是要去突破造成瓶颈的“限制条件”;
数据质量限制:
算法限制:
本质是因为当前算法难以突破语义鸿沟,而以下两点问题当下尤为明显:
数据采集:
数据传输:
处理方式:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。