当前位置:   article > 正文

OpenCV实践之路——人脸识别之二模型训练_opencv多次训练一个人脸文件

opencv多次训练一个人脸文件

在之前的博客人脸识别之一数据收集和预处理之中,已经下载了ORL人脸数据库,并且为了识别自己的人脸写了一个拍照程序自拍。之后对拍的照片进行人脸识别和提取,最后我们得到了一个包含自己的人脸照片的文件夹s41。在博客的最后我们提到了一个非常重要的文件——at.txt。

 

一、csv文件的生成

 

当我们写人脸模型的训练程序的时候,我们需要读取人脸和人脸对应的标签。直接在数据库中读取显然是低效的。所以我们用csv文件读取。csv文件中包含两方面的内容,一是每一张图片的位置所在,二是每一个人脸对应的标签,就是为每一个人编号。这个at.txt就是我们需要的csv文件。生成之后它里面是这个样子的:

 

 

前面是图片的位置,后面是图片所属人脸的人的标签。

要生成这样一个文件直接用手工的方式一个一个输入显然不可取的,毕竟这里有400多张图片。而且这种重复性的工作估计也没人想去做。所以我们可以用命令行的方式简化工作量;或者用opencv自带的Python脚本来自动生成。

命令行方式是这样的。比如我的数据集在C:\Users\bingbuyu\Downloads\att_faces文件夹下面,我就用下面两行命令:

 

 

然后数据集文件夹下面就多出了一个at.txt文件,但是现在是只有路径没有标签的。像下面这样:

 

 

标签需要手动敲上去。。。也挺麻烦的。

好在opencv教程里面为我们提供了自动生成csv文件的脚本。路径类似这样:F:\opencv\sources\modules\contrib\doc\facerec\src\create_csv.py。我不知道怎么用命令行参数的形式运行Python脚本,所以只能把代码里面的BASE_PATH手动的改成自己的数据集路径,改完大致是这样:

 

  1. #!/usr/bin/env python
  2. import sys
  3. import os.path
  4. # This is a tiny script to help you creating a CSV file from a face
  5. # database with a similar hierarchie:
  6. #
  7. # philipp@mango:~/facerec/data/at$ tree
  8. # .
  9. # |-- README
  10. # |-- s1
  11. # | |-- 1.pgm
  12. # | |-- ...
  13. # | |-- 10.pgm
  14. # |-- s2
  15. # | |-- 1.pgm
  16. # | |-- ...
  17. # | |-- 10.pgm
  18. # ...
  19. # |-- s40
  20. # | |-- 1.pgm
  21. # | |-- ...
  22. # | |-- 10.pgm
  23. #
  24. if __name__ == "__main__":
  25. #if len(sys.argv) != 2:
  26. # print "usage: create_csv <base_path>"
  27. # sys.exit(1)
  28. #BASE_PATH=sys.argv[1]
  29. BASE_PATH="C:/Users/bingbuyu/Downloads/att_faces"
  30. SEPARATOR=";"
  31. fh = open("../etc/at.txt",'w')
  32. label = 0
  33. for dirname, dirnames, filenames in os.walk(BASE_PATH):
  34. for subdirname in dirnames:
  35. subject_path = os.path.join(dirname, subdirname)
  36. for filename in os.listdir(subject_path):
  37. abs_path = "%s/%s" % (subject_path, filename)
  38. print "%s%s%d" % (abs_path, SEPARATOR, label)
  39. fh.write(abs_path)
  40. fh.write(SEPARATOR)
  41. fh.write(str(label))
  42. fh.write("\n")
  43. label = label + 1
  44. fh.close()


然后运行这个脚本就可以生成一个既有路径又有标签的at.txt了。

 

 

二、训练模型

现在数据集、csv文件都已经准备好了。接下来要做的就是训练模型了。

这里我们用到了opencv的Facerecognizer类。opencv中所有的人脸识别模型都是来源于这个类,这个类为所有人脸识别算法提供了一种通用的接口。文档里的一个小段包含了我们接下来要用到的几个函数:

 

OpenCV 自带了三个人脸识别算法:Eigenfaces,Fisherfaces 和局部二值模式直方图 (LBPH)。这里先不去深究这些算法的具体内容,直接用就是了。如果有兴趣可以去看相关论文。接下来就分别训练这三种人脸模型。这个时候就能体现出Facerecognizer类的强大了。因为每一种模型的训练只需要三行代码:

 

 

  1. Ptr<FaceRecognizer> model = createEigenFaceRecognizer();
  2. model->train(images, labels);
  3. model->save("MyFacePCAModel.xml");
  4. Ptr<FaceRecognizer> model1 = createFisherFaceRecognizer();
  5. model1->train(images, labels);
  6. model1->save("MyFaceFisherModel.xml");
  7. Ptr<FaceRecognizer> model2 = createLBPHFaceRecognizer();
  8. model2->train(images, labels);
  9. model2->save("MyFaceLBPHModel.xml");


当然在这之前要先把之前图片和标签提取出来。这时候就是at.txt派上用场的时候了。

 

 

 

  1. //使用CSV文件去读图像和标签,主要使用stringstream和getline方法
  2. static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';') {
  3. std::ifstream file(filename.c_str(), ifstream::in);
  4. if (!file) {
  5. string error_message = "No valid input file was given, please check the given filename.";
  6. CV_Error(CV_StsBadArg, error_message);
  7. }
  8. string line, path, classlabel;
  9. while (getline(file, line)) {
  10. stringstream liness(line);
  11. getline(liness, path, separator);
  12. getline(liness, classlabel);
  13. if (!path.empty() && !classlabel.empty()) {
  14. images.push_back(imread(path, 0));
  15. labels.push_back(atoi(classlabel.c_str()));
  16. }
  17. }
  18. }


在模型训练好之后我们拿数据集中的最后一张图片做一个测试,看看结果如何。

 

 

 

  1. Mat testSample = images[images.size() - 1];
  2. int testLabel = labels[labels.size() - 1];
  3. <span style="white-space:pre"> </span>//。。。。这里省略部分代码。。。。。。。。
  4. // 下面对测试图像进行预测,predictedLabel是预测标签结果
  5. int predictedLabel = model->predict(testSample);
  6. int predictedLabel1 = model1->predict(testSample);
  7. int predictedLabel2 = model2->predict(testSample);
  8. // 还有一种调用方式,可以获取结果同时得到阈值:
  9. // int predictedLabel = -1;
  10. // double confidence = 0.0;
  11. // model->predict(testSample, predictedLabel, confidence);
  12. string result_message = format("Predicted class = %d / Actual class = %d.", predictedLabel, testLabel);
  13. string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel);
  14. string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel);
  15. cout << result_message << endl;
  16. cout << result_message1 << endl;
  17. cout << result_message2 << endl;


 

 

由于本来的数据集中是40个人,加上自己的人脸集就是41个。标签是从0开始标的,所以在这里我是第40个人。也即是说Actual class应该40。Predicted class也应该是40才说明预测准确。这里我们可以看到结果:

 

 

结果正确。

 

模型训练的全部代码:

 

  1. //#include "stdafx.h"
  2. #include <opencv2/opencv.hpp>
  3. #include <iostream>
  4. #include <fstream>
  5. #include <sstream>
  6. #include <math.h>
  7. using namespace cv;
  8. using namespace std;
  9. static Mat norm_0_255(InputArray _src) {
  10. Mat src = _src.getMat();
  11. // 创建和返回一个归一化后的图像矩阵:
  12. Mat dst;
  13. switch (src.channels()) {
  14. case1:
  15. cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC1);
  16. break;
  17. case3:
  18. cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC3);
  19. break;
  20. default:
  21. src.copyTo(dst);
  22. break;
  23. }
  24. return dst;
  25. }
  26. //使用CSV文件去读图像和标签,主要使用stringstream和getline方法
  27. static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';') {
  28. std::ifstream file(filename.c_str(), ifstream::in);
  29. if (!file) {
  30. string error_message = "No valid input file was given, please check the given filename.";
  31. CV_Error(CV_StsBadArg, error_message);
  32. }
  33. string line, path, classlabel;
  34. while (getline(file, line)) {
  35. stringstream liness(line);
  36. getline(liness, path, separator);
  37. getline(liness, classlabel);
  38. if (!path.empty() && !classlabel.empty()) {
  39. images.push_back(imread(path, 0));
  40. labels.push_back(atoi(classlabel.c_str()));
  41. }
  42. }
  43. }
  44. int main()
  45. {
  46. //读取你的CSV文件路径.
  47. //string fn_csv = string(argv[1]);
  48. string fn_csv = "at.txt";
  49. // 2个容器来存放图像数据和对应的标签
  50. vector<Mat> images;
  51. vector<int> labels;
  52. // 读取数据. 如果文件不合法就会出错
  53. // 输入的文件名已经有了.
  54. try
  55. {
  56. read_csv(fn_csv, images, labels);
  57. }
  58. catch (cv::Exception& e)
  59. {
  60. cerr << "Error opening file \"" << fn_csv << "\". Reason: " << e.msg << endl;
  61. // 文件有问题,我们啥也做不了了,退出了
  62. exit(1);
  63. }
  64. // 如果没有读取到足够图片,也退出.
  65. if (images.size() <= 1) {
  66. string error_message = "This demo needs at least 2 images to work. Please add more images to your data set!";
  67. CV_Error(CV_StsError, error_message);
  68. }
  69. // 下面的几行代码仅仅是从你的数据集中移除最后一张图片
  70. //[gm:自然这里需要根据自己的需要修改,他这里简化了很多问题]
  71. Mat testSample = images[images.size() - 1];
  72. int testLabel = labels[labels.size() - 1];
  73. images.pop_back();
  74. labels.pop_back();
  75. // 下面几行创建了一个特征脸模型用于人脸识别,
  76. // 通过CSV文件读取的图像和标签训练它。
  77. // T这里是一个完整的PCA变换
  78. //如果你只想保留10个主成分,使用如下代码
  79. // cv::createEigenFaceRecognizer(10);
  80. //
  81. // 如果你还希望使用置信度阈值来初始化,使用以下语句:
  82. // cv::createEigenFaceRecognizer(10, 123.0);
  83. //
  84. // 如果你使用所有特征并且使用一个阈值,使用以下语句:
  85. // cv::createEigenFaceRecognizer(0, 123.0);
  86. Ptr<FaceRecognizer> model = createEigenFaceRecognizer();
  87. model->train(images, labels);
  88. model->save("MyFacePCAModel.xml");
  89. Ptr<FaceRecognizer> model1 = createFisherFaceRecognizer();
  90. model1->train(images, labels);
  91. model1->save("MyFaceFisherModel.xml");
  92. Ptr<FaceRecognizer> model2 = createLBPHFaceRecognizer();
  93. model2->train(images, labels);
  94. model2->save("MyFaceLBPHModel.xml");
  95. // 下面对测试图像进行预测,predictedLabel是预测标签结果
  96. int predictedLabel = model->predict(testSample);
  97. int predictedLabel1 = model1->predict(testSample);
  98. int predictedLabel2 = model2->predict(testSample);
  99. // 还有一种调用方式,可以获取结果同时得到阈值:
  100. // int predictedLabel = -1;
  101. // double confidence = 0.0;
  102. // model->predict(testSample, predictedLabel, confidence);
  103. string result_message = format("Predicted class = %d / Actual class = %d.", predictedLabel, testLabel);
  104. string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel);
  105. string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel);
  106. cout << result_message << endl;
  107. cout << result_message1 << endl;
  108. cout << result_message2 << endl;
  109. waitKey(0);
  110. return 0;
  111. }


 

 

-----------------------------------------------

更新:opencv3版本的代码有所改动,请参考较新的博客提示。

-----------------------------------------------

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/263906
推荐阅读
相关标签
  

闽ICP备14008679号