赞
踩
使用Cascade Classifier包括两个主要阶段:训练阶段和检测阶段。需要用到的OpenCV应用程序:opencv_createssamples, opencv_annotation, opencv_traincascade和opencv_visualisation。opencv_createssamples和opencv_traincascade自OpenCV 4.0以来被禁用,但由于3.4和4.x的模型格式相同,因此可以采用3.4版本的程序进行模型训练。
为了训练一个模型,我们需要一组正样本(包含你想检测的实际对象)和一组负样本(包含你不想检测的所有东西)。负样本集必须手动准备,而正样本集则使用opencv_createssamples创建。
WINDOWS:
下载地址https://opencv.org/releases/,目前4.x.x版本中没有训练程序,此处采用3.4.16版本,下载后安装就可以找到对应的exe文件;
LINUX:
下载地址https://opencv.org/releases/,目前4.x.x版本中没有训练程序,此处采用3.4.16版本,编译后生成的目录为“build/bin”
正样本是由opencv_createssamples应用程序创建的。应用程序支持两种生成正样本数据集的方法:
方法1对于固定对象非常有效,但对于不那么严格的对象,它往往很快就会失败,在这种情况下,建议使用方法2。OPENCV甚至指出,100个真实图像可以产生比1000个人工生成的更好的模型。如果依然决定采用方法1,请记住以下几点:
方法1采用单个对象图像,并随机旋转对象、改变图像强度以及将图像放置在任意背景上,从给定对象图像中创建大量正样本。随机性的数量和范围可以通过opencv_createssamples应用程序的命令行参数来控制。
opencv_createsamples的参数说明:
-vec 用于训练的正样本的输出文件名
-img 源对象图像
-bg 背景描述文件,包含一个图像列表,这些图像用作对象随机扭曲版本的背景
-num 生成的正样本数量
-bgcolor 背景色(目前采用灰度图像),背景色为透明色。由于可能存在压缩伪影,因此可以通过-bgthresh指定颜色容错量。bgcolor-bgthresh和bgcolor+bgthresh范围内的所有像素都被解释为透明的。
-bgthresh < background_color_threshold >
-inv 如果指定,颜色将被反转
-randinv 如果指定,颜色将随机反转
-maxidev 前景样本中像素的最大强度偏差
-maxxangle 朝向x轴的最大旋转角度,必须以弧度为单位
-maxyangle 朝向y轴的最大旋转角度,必须以弧度为单位
-maxzangle 朝向z轴的最大旋转角度,必须以弧度为单位
-show 调试选项。如果指定,将显示每个样品。按Esc将继续示例创建过程,但不会显示每个示例
-w 输出样本的宽度(像素)
-h 输出样本的高度(像素)
当以方法1运行opencv_createsamples时,使用以下过程来创建示例对象实例:
正样本也可以从先前标记的图像集合中获得,这是构建robust对象模型时所需的方法。该集合由一个类似于背景描述文件的文本文件描述。这个文件的每一行都对应一个图像。该行的第一个元素是文件名,然后是对象注释的数量,然后是描述对象边界矩形(x, y,宽度,高度)的坐标的数字。
进入posdata目录,然后创建 pos.txt,目录格式如下:
/posdata
00001.jpg
00002.jpg
00003.jpg
pos.txt
pos.txt的内容如下:
00001.jpg 3 548 605 95 100 771 641 125 94 1199 634 182 269
00002.jpg 5 333 464 115 148 844 610 205 259 1139 460 98 138 1315 461 93 101 943 503 57 78
00003.jpg 5 5 491 103 156 472 517 80 114 845 449 151 177 877 631 148 203 1292 482 68 91
图像00001.jpg包含了3个对象,分别是{548,605,95,100},{771,641,125,94},{1199,634,182,269}
为了从这样的集合中创建正样本,应该指定-info参数而不是-img。注意,在方法2中,-bg、-bgcolor、-bgthreshold、-inv、-randinv、-maxxangle、-maxyangle、-maxzangle等参数将被忽略,不再使用。方法2创建示例的方案如下:
生成VEC指令:
opencv_createsamples -info ${FILEINFO_POS} -vec ${FILEVEC_POS} -num ${NUM_POS} -bgcolor 0 -bgthresh 0 ${SIZ_POS}
创建info描述文件的过程也可以通过使用opencv_annotation工具来完成。这是一个开源工具,用于在任何给定图像中可视化地选择对象实例感兴趣的区域。
使用该工具非常简单。该工具接受几个必需的和一些可选的参数:
-?, -h, --help, --usage (value:true)
显示帮助信息
-a, --annotations 必选参数,指定生成info描述文件的路径
-i,--images 必选参数,包含样本的目录路径
-m,--maxWindowHeight 可选参数,如果输入图像的高度大于这里给定的分辨率,请使用resizeFactor调整图像的大小
-r,--resizeFactor 可选参数,当使用maxWindowHeight参数时,用于调整输入图像大小的因子(默认:一半大小)。
示例:
./opencv_annotation -a=sample_people/posdata/pos.txt -i=sample_people/posdata/
opencv_annotation命令将打开一个窗口,其中包含第一个图像和用于注释的鼠标光标。鼠标左键用于选择对象的第一个角,然后继续绘制直到确定为止,并在第二次单击鼠标左键时停止。每次选择后,您有以下选择:
按c键:确认标注,标注变为绿色,确认已保存
按d键:从注释列表中删除最后一个注释(方便删除错误注释)
按n键:继续下一个图像
按ESC:退出注释软件
最后,您将得到一个可用的注释文件,它可以传递给opencv_createssamples的-info参数。
负样本取自任意图像,图像中应不包含想要检测的对象。这些负样本图像被记录在一个负样本描述文件中,描述文件的每行包含一个图像的路径(可以是绝对路径或相对路径)。请注意,负样本和样本图像也称为背景样本或背景图像。
描述的图像可能有不同的大小,然而每个图像都应该等于或大于期望的训练窗口大小(模型尺寸,大多数情况下是对象的平均大小)。
负样本也不能随意的找些图片来作为负样本。最好根据不同的项目选择不同的负样本。比如一个项目是做机场的人脸检测,那么就最好从现场拍摄一些图片数据回来,从中采集负样本。不同的项目,就采集不同的正样本和负样本。
进入negdata目录,然后创建 neg.txt,目录格式如下:
/negdata
00001.jpg
00002.jpg
00003.jpg
00004.jpg
neg.txt
neg.txt的内容如下:
00001.jpg
00002.jpg
00003.jpg
00004.jpg
通用参数:
-data 训练好的分类器存储的位置,这个文件夹应该事先手动创建
-vec 带有正样本的vec文件
-bg 背景描述文件,包含负样本图像的文件
-numPos 每个分类器阶段训练中使用的正样本数量。
-numNeg 每个分类器阶段训练中使用的负样本数量。
-numStages 要训练的级联阶段的数量。
-precalcValBufSize 预计算特征值的缓冲区大小(单位为Mb)。
-precalcIdxBufSize 预计算特征索引的缓冲区大小(单位:Mb)。
注意:precalcValBufSize和precalcIdxBufSize分配的内存越多,训练过程就越快,但是不应超过可用的系统内存。
-baseFormatSave 仅在使用Haar特征时有效。如果指定了该参数,则级联将以旧格式保存。
-numThreads 训练期间使用的最大线程数。注意,实际使用的线程数可能更少,这取决于您的机器和编译选项。默认情况下,如果您使用TBB支持构建OpenCV,则选择最大可用线程,这是此优化所需要的。
-acceptanceRatioBreakValue 用于确定你的模型应该保持学习的精确程度以及何时停止。一个好的指导方针是训练不超过10e-5,以确保模型不会在你的训练数据上过度训练。缺省情况下,该值设置为-1,表示禁用该特性。
级联参数
-stageType 级别(stage)参数。目前只支持将BOOST分类器作为级联的类型;
-featureType 特征的类型:HAAR-类Haar特征;LBP-局部二进制模式(默认Harr);
如果遇到的教程提到旧的opencv_haartraining工具(已弃用),请忽略该教程并使用opencv_traincascade工具。openv_traincascade同时支持HAAR和LBP特征。与HAAR特征相比,LBP特征产生整数精度,产生浮点精度,因此LBP的训练和检测速度都比HAAR特征快几倍。对于LBP和HAAR的检测质量,主要取决于所使用的训练数据和所选择的训练参数。
-w 训练样本的度(像素,默认24);
-h 训练样本的度(像素,默认24);
注意:训练样本的尺寸必须跟训练样本创建(使用 opencv_createsamples 程序创建)时的尺寸保持一致
Boosted分类器参数
-bt
Boosted分类器的类型(DAB-Discrete AdaBoost, RAB-Real AdaBoost, LB-LogitBoost,GAB-Gentle AdaBoost为默认);
-minHitRate
每个阶段的最小期望命中率(默认值为0.995)。总命中率可以估计为(minHitRate^ number_of_stages)
-maxFalseAlarmRate
每一级希望得到的最大误检率(默认值为0.5),总的误检率大约为 maxFalseAlarmRate^number_of_stages;
-weightTrimRate
是否应该使用微调及其权重。一个不错的选择是0.95。
-maxDepth
弱树的最大深度。一个合适的选择是1,这是树桩的情况。
-maxWeakCount
每个级联阶段弱树的最大计数(默认值为100)。boosted分类器(阶段)将有许多弱树(<=maxWeakCount),以实现给定的-maxFalseAlarmRate。
Haar-like 特征参数
-mode
选择训练中使用的Haar特征集的类型。BASIC只使用直立特征,而ALL使用全套直立和45度旋转特征集。
opencv_traincascade应用程序完成其工作后,训练好的级联将保存在-data文件夹中的cascade.xml文件中。此文件夹中的其他文件是为培训中断而创建的,您可以在培训结束后删除。
训练指令:
opencv_traincascade -data ${PATH_OUT} -vec ${FILEVEC_POS} -bg ${FILEINFO_NEG} -numPos ${NUM_POS} -numNeg ${NUM_NEG} -numStages 20 -feattureType HAAR ${SIZ_POS} -minHitRate 0.995 -maxFalseAlarmRate 0.5
可视化训练后的级联是很有用的,可以看到它选择了哪些特征,以及它的阶段有多复杂。为此,OpenCV提供了一个opencv_visualisation应用程序。这个应用程序有以下命令:
-?, -h, --help, --usage
显示帮助信息
-d, --data
(可选)如果提供了一个数据文件夹,必须事先手动创建,将存储阶段输出和特征的视频
-i, --image
(必选):指向对象模型的参考图像的路径。应该是一个维度为[-w,-h]的注释(annotation),同时传递给opencv_createssamples和opencv_traincascade应用程序。
-m, --model
(必选):训练模型的路径,它应该在openv_traincascade应用程序的-data参数提供的文件夹中。
示例
./opencv_visualisation -m=output/sample_people/cascade.xml -d=output/sample_people/ -i=sample_people/posdata/object.jpg
当前可视化工具的一些局限性
问题描述:Traincascade Error: Bad argument (Can not get new positive sample. The most possible reason is insufficient count of samples in given vec-file.
解决办法:主要是numPos的值设置的不对,把numPos简单设置成正样本数量,将numPos设置正样本数量*4/5即可。
问题描述:(-215:Assertion failed) !ssize.empty() in function ‘resize’
解决办法:描述文件中的样本点数据错误导致;
基于人头(正样本4100,负样本23240)、汽车(正样本516,负样本1044)、行人((正样本1126,负样本1000))和实际环境(正样本79,负样本19)训练,感觉最终的效果都不是很好。有知道原因,或者有想法的可以一起交流。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。