当前位置: article > 正文

浅谈计算机视觉与自然语言处理_自然语言处理和计算机视觉

作者：小丑西瓜9 | 2024-03-16 18:38:19

踩

自然语言处理和计算机视觉

原创：杨其泓

1. 计算机视觉

1.1. 什么是计算机视觉

计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学，更进一步地说，是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量的科学。近几年计算机视觉技术实现了快速发展，其主要学术原因，是2015年基于深度学习的计算机视觉算法在ImageNet数据库上的识别准确率首次超过人类，使之具真正具有了实际应用的能力（要不然别人会说：你找几个人来干不是更好吗），同年Google也开源了自己的深度学习算法。
计算机视觉的众多实际应用，细化下来都可以拆分成某个具体任务。

计算机视觉四大任务

图像分类：把图像划归为若干个类别中的某一种
图像分类+定位：把图像划归为若干个类别中的某一种，并给出被分类物体的位置
物体检测：用框去标出图像中物体的位置，并给出物体的类别（人脸检测、安全帽检测、车辆检测都属于这个）
图像分割：以像素级单位把图像分成若干个特定的、具有独特性质的区域并给出物体的类别（车道线分割项目就是用的这个，属于自动驾驶的一部分）

1.2. 基本任务流程

计算机视觉任务的主要流程有图像获取、预处理、特征提取、检测/分割和高级处理共计5个步骤。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小丑西瓜9/article/detail/251360?site