赞
踩
一、概述
目标识别是指一个特殊目标(或一种类型的目标)从其它目标(或其它类型的目标)中被区分出来的过程。一般,我们可将识别能力由高到低分为三个层次:
1、仪器水平:物理识别
2、动物水平:模糊识别
3、人类智能水平:情感识别
其中,物理识别是对接受到的信息实现物理、化学和生物学的量化认识。这种识别的特点是识别内容分别独立互不相关,事件具有精确的重复性,无需经验和智能,完全可以程序化。所以它是最低层次的识别。模糊识别是在大量复杂的信息中识别出有用的部分,即对接收的信息与以往的记忆和经验进行关联认识,剔除无关的信息。
二、图像识别
1、基本知识
样本:一类事物的一个具体体现,对具体的个别事物进行观测所得到的某种形式的信号或表达
模式:表示一类事物,表示对某类事物特征或属性的抽象的描述。由多个描述子组成
模式类:模式所属的类别或同一类中模式的总体成为模式类,是具有某些公共特征的模式的系列,模式类与模式联合使用时,模式表示具体的事物,而模式类则是对这一类事物的概念性描述。
2、基本方式
(1)从待分类的图像中提取能够代表或排除某些类别的特征
(2)根据特征将图像目标分到相应的类别中
其中,图像的分类过程为:
①学习过程:首先分离具有典型性的特征,根据这些特征对每个类别建立独立的描述,建立特征相应的特征空间。
②测试过程:根据输入的样本和特征空间的划分,对全体图像进行分类。
三、图像识别的基本方法
统计分类方法:在对分类图像进行大量统计分析的基础上,找出规律性,抽取能够反映目标特征的统计向量进行识别。
句法结构方法:通过对图像结构的分析,将图像用一些语句来表达,通过符号匹配、语法分析等,实现图像中目标的识别。
1、统计分类方法
对样本x进行分类主要经过两个阶段:
(1)分析阶段(学习阶段):确定需分类的目标与类别
对每一种类别,选定一组目标样本,然后对样本数据进行分析,形成不同类别目标的特征向量,每个向量构成一个模式。
(2)识别阶段
对待分类图像进行必要的预处理与特征提取,按照上述各类别的特征向量,对提取的特征进行判决分类,确定其归属的类别。
统计分类方法中有一些常见的方法:
方法一:最小距离分类器
假设现有两个模板m1和m2,判断未知模式向量x,判断x与m1和m2距离,如果与m1的距离小于与m2的距离,则x属于w1,否则属于w2。
方法二:相关匹配
用样板子图像直接作为模式,通过子图像与原图像直接进行相关计算,把相关计算结果作为决策函数,相关计算获得最大值的位置就被认为匹配成功。
2、句法结构方法
句法结构方法中的各个环节都围绕着语法的研究展开,定义了字符集、句子、语言,字符组成句子,句子组成语言。常见的方法有匹配形状树法和串匹配法。
(1)匹配形状数
形状数:描述一个对象的边界,结构时,所得到的表达式或特征数,可视为模式串、模式数的一种通用表述。
匹配形状数法是通过两个对象边界的形状数的相似程度来匹配对象。两个区域边界的相似级别k是指相同形状数的最大序号,两个区域边界的形状数的距离D定义为相似级别K的倒数。用不同密度的网格划分边界区域,就会获得不同序数的形状数。
如果使用相似级别k,k越大说明越相似;如果使用相似距离D,D越小说明越相似
(2)串匹配
串匹配是指比较两个边界的串编码的相似程度来进行匹配
设两个区域边界A和B已分别被编码为
四、算法介绍
1、CNN
卷积神经网络是目前图像识别用途最广,最简单的深度学习算法。它的工作原理如下图:
向网络中输入一张图片,接着将它传递到多个卷积和池化层中,最后输出目标所属的类别。
(1)输入图片
(2)将图片分成几个区域
(3)将每个区域堪称单独的图片
(4)把这些图片分成不同的类别
(5)把结果结合在一起,完成。
这种方法的问题是有时需要划分多个区域,导致计算量比较大,为解决这一问题,就有了RCNN。
2、RCNN
在RCNN中,我们会事先创建多个边界框,其主要步骤如下:
(1)预先取一个预训练卷积神经网络。
(2)根据需要检测的目标类别数量,训练网络的最后一层。
(3)对图片中感兴趣的区域重新改造,以让其符合CNN的输入尺寸要求。
(4)得到这些区域后,我们训练支持向量机(SVM)来辨别目标物体和背景,对每个类别训练一个二元SVM。
(5)训练一个线性回归模型,为每个辨识到的物体生成更精确的边界框。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。