当前位置:   article > 正文

YOLOv5实战之PCB板缺陷检测

基于yolo的pcb板缺陷检测

点击上方“小白学视觉”,选择加"星标"或“置顶

 
 
重磅干货,第一时间送达

一、数据集介绍

本教程主要是利用YOLOv5算法实现对PCB板上的缺陷进行检测识别。使用的DeepPCB缺陷数据集中的所有图像都是从线性扫描CCD获得的,分辨率约为每1毫米48个像素,以上述方式从采样图像中手动检查

测试图像的原始大小约为16k x 16k像素, 然后将它们裁剪成许多大小为640 x 640的子图像,共1500张图片,DeepPCB数据集中的部分图片如下图所示。

PCB面板数据集已经上传,可以在此下载https://download.csdn.net/download/qq_40716944/24875013

8e4aa038896638020120ea7ef2ba58b0.jpeg

对于测试图像中的每个缺陷,我们使用轴对齐的边界框和一个类ID。 如上所示,我们标注了六种常见的PCB缺陷类型:open、short、mousebite、spur、pin-hole、spur。 

由于实际测试图像中只有少数缺陷,我们根据 PCB 缺陷模式在每个测试图像上手动论证一些人工缺陷,这导致每个640 x 640图像中大约有3到12个缺陷。

PCB缺陷数如下图所示。 我们将1000 张图像作为训练集,剩下的作为测试集。

c5379e2c1409c0d670dc8e261e72cd60.png

二、构建训练数据集 

1、先构建数据集文件夹

本人按照VOC格式创建数据集,具体格式如下:

  1. ├── data
  2. │   ├── xml  进行 detection 任务时的标签文件,xml 形式,文件名与图片名一一对应
  3. │   ├── image  存放.jpg 格式的图片文件
  4. │   ├── label  存放label标注信息的txt文件,与图片一一对应
  5. │   ├── txt  存放原始标注信息,x1,y1,x2,y2,type
  6. ├── dataSet(train,val,test建议按照811比例划分)
  7. │   ├── train.txt  写着用于训练的图片名称
  8. │   ├── val.txt  写着用于验证的图片名称
  9. │   ├── trainval.txt  train与val的合集
  10. │   ├── test.txt  写着用于测试的图片名称

2、数据集格式转换

原始的标注信息是保存成txt文件,txt文件里面的每一行都包含一个标注信息,格式为x1,y1,x2,y2,type,这里 (x1,y1) 和 (x2,y2) 是缺陷边界框的左上角和右下角

type是匹配后的整数 ID:0-background、1-open、2-short、3-mousebite、4-spur、5-copper、6-pin-hole。通过一下代码进行转换:

  1. import os
  2. import cv2
  3. import time
  4. from xml.dom import minidom
  5. name_dict = {'0': 'background', '1': 'open', '2': 'short',
  6.             '3': 'mousebite', '4': 'spur', '5': 'copper', '6': 'pin-hole'}
  7. def transfer_to_xml(pic, txt, file_name,xml_save_path):
  8.    if not os.path.exists(xml_save_path):
  9.        os.makedirs(xml_save_path,exist_ok=True)
  10.    img = cv2.imread(pic)
  11.    img_w = img.shape[1]
  12.    img_h = img.shape[0]
  13.    img_d = img.shape[2]
  14.    doc = minidom.Document()
  15.    annotation = doc.createElement("annotation")
  16.    doc.appendChild(annotation)
  17.    folder = doc.createElement('folder')
  18.    folder.appendChild(doc.createTextNode('visdrone'))
  19.    annotation.appendChild(folder)
  20.    filename = doc.createElement('filename')
  21.    filename.appendChild(doc.createTextNode(file_name))
  22.    annotation.appendChild(filename)
  23.    source = doc.createElement('source')
  24.    database = doc.createElement('database')
  25.    database.appendChild(doc.createTextNode("Unknown"))
  26.    source.appendChild(database)
  27.    annotation.appendChild(source)
  28.    size = doc.createElement('size')
  29.    width = doc.createElement('width')
  30.    width.appendChild(doc.createTextNode(str(img_w)))
  31.    size.appendChild(width)
  32.    height = doc.createElement('height')
  33.    height.appendChild(doc.createTextNode(str(img_h)))
  34.    size.appendChild(height)
  35.    depth = doc.createElement('depth')
  36.    depth.appendChild(doc.createTextNode(str(img_d)))
  37.    size.appendChild(depth)
  38.    annotation.appendChild(size)
  39.    segmented = doc.createElement('segmented')
  40.    segmented.appendChild(doc.createTextNode("0"))
  41.    annotation.appendChild(segmented)
  42.    with open(txt, 'r') as f:
  43.        lines = [f.readlines()]
  44.        for line in lines:
  45.            for boxes in line:
  46.                box = boxes.strip('\n')
  47.                box = box.split(" ")
  48.                x_min = box[0]
  49.                y_min = box[1]
  50.                x_max = box[2]
  51.                y_max = box[3]
  52.                object_name = name_dict[box[4]]
  53.                if object_name != "background":
  54.                    object = doc.createElement('object')
  55.                    nm = doc.createElement('name')
  56.                    nm.appendChild(doc.createTextNode(object_name))
  57.                    object.appendChild(nm)
  58.                    pose = doc.createElement('pose')
  59.                    pose.appendChild(doc.createTextNode("Unspecified"))
  60.                    object.appendChild(pose)
  61.                    truncated = doc.createElement('truncated')
  62.                    truncated.appendChild(doc.createTextNode("1"))
  63.                    object.appendChild(truncated)
  64.                    difficult = doc.createElement('difficult')
  65.                    difficult.appendChild(doc.createTextNode("0"))
  66.                    object.appendChild(difficult)
  67.                    bndbox = doc.createElement('bndbox')
  68.                    xmin = doc.createElement('xmin')
  69.                    xmin.appendChild(doc.createTextNode(x_min))
  70.                    bndbox.appendChild(xmin)
  71.                    ymin = doc.createElement('ymin')
  72.                    ymin.appendChild(doc.createTextNode(y_min))
  73.                    bndbox.appendChild(ymin)
  74.                    xmax = doc.createElement('xmax')
  75.                    xmax.appendChild(doc.createTextNode(str(x_max)))
  76.                    bndbox.appendChild(xmax)
  77.                    ymax = doc.createElement('ymax')
  78.                    ymax.appendChild(doc.createTextNode(str(y_max)))
  79.                    bndbox.appendChild(ymax)
  80.                    object.appendChild(bndbox)
  81.                    annotation.appendChild(object)
  82.                    with open(os.path.join(xml_save_path, file_name + '.xml'), 'w') as x:
  83.                        x.write(doc.toprettyxml())
  84.                    x.close()
  85.    f.close()
  86. if __name__ == '__main__':
  87.    t = time.time()
  88.    print('Transfer .txt to .xml...ing....')
  89.    txt_folder = 'data/PCBDatasets/txt'
  90.    txt_file = os.listdir(txt_folder)
  91.    img_folder = 'data/PCBDatasets/image'
  92.    xml_save_path = 'data/PCBDatasets/xml/'
  93.    for txt in txt_file:
  94.        txt_full_path = os.path.join(txt_folder, txt)
  95.        img_full_path = os.path.join(img_folder, txt.split('.')[0] + '.jpg')
  96.        try:
  97.            transfer_to_xml(img_full_path, txt_full_path, txt.split('.')[0],xml_save_path)
  98.        except Exception as e:
  99.            print(e)
  100.    print("Transfer .txt to .XML sucessed. costed: {:.3f}s...".format(time.time() - t))

3、训练集划分代码

主要是将数据集分类成训练数据集和测试数据集,默认train,val,test按照比例进行随机分类,运行后dataSet文件夹中会出现四个文件

主要是生成的训练数据集和测试数据集的图片名称,如下图。同时data目录下也会出现这四个文件,内容是训练数据集和测试数据集的图片路径。

  1. import os
  2. import random
  3. trainval_percent = 0.9
  4. train_percent = 0.9
  5. xmlfilepath = 'data/PCBDatasets/xml/'
  6. txtsavepath = 'data/PCBDatasets/dataSet/'
  7. total_xml = os.listdir(xmlfilepath)
  8. num = len(total_xml)
  9. list = range(num)
  10. tv = int(num * trainval_percent)
  11. tr = int(tv * train_percent)
  12. trainval = random.sample(list, tv)
  13. train = random.sample(trainval, tr)
  14. ftrainval = open('data/PCBDatasets/dataSet/trainval.txt', 'w')
  15. ftest = open('data/PCBDatasets/dataSet/test.txt', 'w')
  16. ftrain = open('data/PCBDatasets/dataSet/train.txt', 'w')
  17. fval = open('data/PCBDatasets/dataSet/val.txt', 'w')
  18. for i in list:
  19.    name = total_xml[i][:-4] + '\n'
  20.    if i in trainval:
  21.        ftrainval.write(name)
  22.        if i in train:
  23.            ftrain.write(name)
  24.        else:
  25.            fval.write(name)
  26.    else:
  27.        ftest.write(name)
  28. ftrainval.close()
  29. ftrain.close()
  30. fval.close()
  31. ftest.close()

4、生成yolo格式的标签

主要是将图片数据集标注后的xml文件中的标注信息读取出来并写入txt文件,运行后在label文件夹中出现所有图片数据集的标注信息

  1. # xml解析包
  2. import xml.etree.ElementTree as ET
  3. import pickle
  4. import os
  5. # os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表
  6. from os import listdir, getcwd
  7. from os.path import join
  8. sets = ['train', 'test', 'val']
  9. classes = ['open', 'short','mousebite','spur', 'copper', 'pin-hole']
  10. # 进行归一化操作
  11. def convert(size, box):  # size:(原图w,原图h) , box:(xmin,xmax,ymin,ymax)
  12.    dw = 1./size[0]     # 1/w
  13.    dh = 1./size[1]     # 1/h
  14.    x = (box[0] + box[1])/2.0   # 物体在图中的中心点x坐标
  15.    y = (box[2] + box[3])/2.0   # 物体在图中的中心点y坐标
  16.    w = box[1] - box[0]         # 物体实际像素宽度
  17.    h = box[3] - box[2]         # 物体实际像素高度
  18.    x = x*dw    # 物体中心点x的坐标比(相当于 x/原图w)
  19.    w = w*dw    # 物体宽度的宽度比(相当于 w/原图w)
  20.    y = y*dh    # 物体中心点y的坐标比(相当于 y/原图h)
  21.    h = h*dh    # 物体宽度的宽度比(相当于 h/原图h)
  22.    return (x, y, w, h)    # 返回 相对于原图的物体中心点的x坐标比,y坐标比,宽度比,高度比,取值范围[0-1]
  23. def convert_annotation(image_id):
  24.    '''
  25.    将对应文件名的xml文件转化为label文件,xml文件包含了对应的bunding框以及图片长款大小等信息,
  26.    通过对其解析,然后进行归一化最终读到label文件中去,也就是说
  27.    一张图片文件对应一个xml文件,然后通过解析和归一化,能够将对应的信息保存到唯一一个label文件中去
  28.    labal文件中的格式:calss x y w h  同时,一张图片对应的类别有多个,所以对应的bounding的信息也有多个
  29.    '''
  30.    # 对应的通过year 找到相应的文件夹,并且打开相应image_id的xml文件,其对应bund文件
  31.    in_file = open('data/PCBDatasets/xml/%s.xml' % (image_id), encoding='utf-8')
  32.    # 准备在对应的image_id 中写入对应的label,分别为
  33.    # <object-class> <x> <y> <width> <height>
  34.    out_file = open('data/PCBDatasets/label/%s.txt' % (image_id), 'w', encoding='utf-8')
  35.    # 解析xml文件
  36.    tree = ET.parse(in_file)
  37.    # 获得对应的键值对
  38.    root = tree.getroot()
  39.    # 获得图片的尺寸大小
  40.    size = root.find('size')
  41.    # 如果xml内的标记为空,增加判断条件
  42.    if size != None:
  43.        # 获得宽
  44.        w = int(size.find('width').text)
  45.        # 获得高
  46.        h = int(size.find('height').text)
  47.        # 遍历目标obj
  48.        for obj in root.iter('object'):
  49.            # 获得difficult ??
  50.            difficult = obj.find('difficult').text
  51.            # 获得类别 =string 类型
  52.            cls = obj.find('name').text
  53.            # 如果类别不是对应在我们预定好的class文件中,或difficult==1则跳过
  54.            if cls not in classes or int(difficult) == 1:
  55.                continue
  56.            # 通过类别名称找到id
  57.            cls_id = classes.index(cls)
  58.            # 找到bndbox 对象
  59.            xmlbox = obj.find('bndbox')
  60.            # 获取对应的bndbox的数组 = ['xmin','xmax','ymin','ymax']
  61.            b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
  62.                 float(xmlbox.find('ymax').text))
  63.            print(image_id, cls, b)
  64.            # 带入进行归一化操作
  65.            # w = 宽, h = 高, b= bndbox的数组 = ['xmin','xmax','ymin','ymax']
  66.            bb = convert((w, h), b)
  67.            # bb 对应的是归一化后的(x,y,w,h)
  68.            # 生成 calss x y w h 在label文件中
  69.            out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
  70. # 返回当前工作目录
  71. wd = getcwd()
  72. print(wd)
  73. for image_set in sets:
  74.    '''
  75.    对所有的文件数据集进行遍历
  76.    做了两个工作:
  77.     1.将所有图片文件都遍历一遍,并且将其所有的全路径都写在对应的txt文件中去,方便定位
  78.     2.同时对所有的图片文件进行解析和转化,将其对应的bundingbox 以及类别的信息全部解析写到label 文件中去
  79.         最后再通过直接读取文件,就能找到对应的label 信息
  80.    '''
  81.    # 先找labels文件夹如果不存在则创建
  82.    if not os.path.exists('data/PCBDatasets/labels/'):
  83.        os.makedirs('data/PCBDatasets/labels/')
  84.    # 读取在ImageSets/Main 中的train、test..等文件的内容
  85.    # 包含对应的文件名称
  86.    image_ids = open('data/PCBDatasets/dataSet/%s.txt' % (image_set)).read().strip().split()
  87.  
  88.    list_file = open('data/PCBDatasets/%s.txt' % (image_set), 'w')
  89.    # 将对应的文件_id以及全路径写进去并换行
  90.    for image_id in image_ids:
  91.        list_file.write('data/PCBDatasets/image/%s.jpg\n' % (image_id))
  92.        # 调用  year = 年份  image_id = 对应的文件名_id
  93.        convert_annotation(image_id)
  94.    # 关闭文件
  95.    list_file.close()

label文件夹中某文件内容如下:

858f6ff29ab5d100fef12ebb3e912f59.png

三、修改配置文件

1、数据配置文件

首先需要在/yolov5-master/data文件夹中,新建一个PCBDetect.yaml文件,内容设置如下:

  1. train: data/PCBDatasets/dataSet/train.txt
  2. val:  data/PCBDatasets/dataSet/val.txt
  3. test: data/PCBDatasets/dataSet/test.txt
  4. nc: 6
  5. names: ['copper', 'mousebite', 'open', 'pin-hole', 'short', 'spur']

2、网络参数修改

对yolov5-master/model文件夹中,对yolov5x.yaml(根据自己选择的模型而定)文件内容修改。

c2dc7b1a4a69a13542ede1fdb8924fcb.png

3、trian.py修改

主要用到的几个参数:–weights,–cfg,–data,–epochs,–batch-size,–img-size,–project,-workers

重点注意:–weights,–cfg,–data,其他的默认即可(batch_size,workers根据自己电脑属性进行设置)。

c967543195f9b6f9cd4c804d230591ef.png

四、训练及测试

1、训练

在完成上述所有的操作之后,就可以进行训练,在命令窗口输入python train.py即可以进行训练。

09cdfec67e8886f6c2016ddc53d5bd15.png

98b0c0694bbc84cca9efa9414d56735b.png

2、测试

在训练完成后可以利用测试集对训练后的模型进行测试,利用val.py文件进行测试,主要修改一下地方:

1bb3529c38a6900d38c18dafb4067b39.png

测试完成后会输出map、precision、recall等指标,具体如下图所示:

3df0e169ef3e6434a4ef25a971ac0edb.png

  P-R曲线如下图所示:

6de076516c79a6c0609dce4ceee5d3b1.png

同时也可以利用detect.py文件对测试集进行测试,将检测后的框绘制在图像上,部分测试结果如下图所示:

b84e5a8ddce45642358127366ec78271.png

12c1250ce0b1fb9614addc815da57202.png

版权声明:本文为CSDN博主「AI追随者」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:

https://blog.csdn.net/qq_40716944/article/details/120483522

  1. 下载1:OpenCV-Contrib扩展模块中文版教程
  2. 在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
  3. 下载2:Python视觉实战项目52
  4. 在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。
  5. 下载3:OpenCV实战项目20
  6. 在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。
  7. 交流群
  8. 欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/749335
推荐阅读
相关标签
  

闽ICP备14008679号