当前位置:   article > 正文

浅谈计算机视觉与自然语言处理_自然语言处理和计算机视觉

自然语言处理和计算机视觉

原创:杨其泓

1. 计算机视觉

1.1. 什么是计算机视觉

计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学, 更进一步地说,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和 测量的科学。近几年计算机视觉技术实现了快速发展,其主要学术原因,是2015年基于深度学习的计算机视觉算法在ImageNet数据库上的识别准确率首次超过人类,使之具真正具有了实际应用的能力(要不然别人会说:你找几个人来干不是更好吗),同年Google也开源了自己的深度学习算法。
计算机视觉的众多实际应用,细化下来都可以拆分成某个具体任务。

计算机视觉四大任务
计算机视觉四大任务

  1. 图像分类:把图像划归为若干个类别中的某一种
  2. 图像分类+定位:把图像划归为若干个类别中的某一种,并给出被分类物体的位置
  3. 物体检测:用框去标出图像中物体的位置,并给出物体的类别(人脸检测、安全帽检测、车辆检测都属于这个)
  4. 图像分割:以像素级单位把图像分成若干个特定的、具有独特性质的区域并给出物体的类别(车道线分割项目就是用的这个,属于自动驾驶的一部分)

1.2. 基本任务流程

计算机视觉任务的主要流程有图像获取、预处理、特征提取、检测/分割和高级处理共计5个步骤。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/251360?site
推荐阅读
相关标签
  

闽ICP备14008679号