赞
踩
我用的是开源的自动驾驶数据集BDD100K,数据集中包含train,val和test的image和label,其中label是json格式的。
yolo使用的label是txt格式的,所以需要先将json格式转换成txt格式。有多种方式可以转换:第一次训练的时候我用的是先将json转换成xml,再将xml转换成txt,这种方式我没找到怎么进行数据清洗的方法;第二次训练的时候我用的是直接将json转换成txt,这种方式可以在里面添加一些函数用于过滤掉黑夜和过于小的目标的图片,进行数据清洗。
第一次训练的时候分了10个类:
第二次训练的时候分了3个类:
这是json转xml的代码:
- # jsonToXml
- import os
- import json
- import sys
- from xml.etree import ElementTree
- from xml.etree.ElementTree import Element, SubElement
- from lxml import etree
- from xml.dom.minidom import parseString
-
- # 数据集个类别
- categorys = ['car', 'bus', 'person', 'bike', 'truck', 'motor', 'train', 'rider', 'traffic sign', 'traffic light']
-
-
- def parseJson(jsonFile):
- '''
- params:
- jsonFile -- BDD00K数据集的一个json标签文件
- return:
- 返回一个列表的列表,存储了一个json文件里面的方框坐标及其所属的类,
- 形如:[[325, 342, 376, 384, 'car'], [245, 333, 336, 389, 'car']]
- '''
- objs = []
- obj = []
- f = open(jsonFile)
- info = json.load(f)
- objects = info['frames'][0]['objects']
- for i in objects:
- if (i['category'] in categorys):
- obj.append(int(i['box2d']['x1']))
- obj.append(int(i['box2d']['y1']))
- obj.append(int(i['box2d']['x2']))
- obj.append(int(i['box2d']['y2']))
- obj.append(i['category'])
- objs.append(obj)
- obj = []
- # print("objs",objs)
- return objs
-
-
- class PascalVocWriter:
-
- def __init__(self, foldername, filename, imgSize, databaseSrc='Unknown', localImgPath=None):
- '''
- params:
- foldername -- 要存储的xml文件的父目录
- filename -- xml文件的文件名
- imgSize -- 图片的尺寸
- databaseSrc -- 数据库名,这里不需要,默认为Unknown
- localImaPath -- xml文件里面的<path></path>标签的内容
- '''
- self.foldername = foldername
- self.filename = filename
- self.databaseSrc = databaseSrc
- self.imgSize = imgSize
- self.boxlist = []
- self.localImgPath = localImgPath
-
- def prettify(self, elem):
- """
- params:
- elem -- xml的根标签,以<annotation>开始
- return:
- 返回一个美观输出的xml(用到minidom),本质是一个str
- """
- xml = ElementTree.tostring(elem)
- dom = parseString(xml)
- # print(dom.toprettyxml(' '))
- prettifyResult = dom.toprettyxml(' ')
- return prettifyResult
-
- def genXML(self):
- """
- return:
- 生成一个VOC格式的xml,返回一个xml的根标签,以<annotation>开始
- """
- # Check conditions
- if self.filename is None or \
- self.foldername is None or \
- self.imgSize is None or \
- len(self.boxlist) <= 0:
- return None
-
- top = Element('annotation') # 创建一个根标签<annotation>
- folder = SubElement(top, 'folder') # 在根标签<annotation>下创建一个子标签<folder>
- folder.text = self.foldername # 用self.foldername的数据填充子标签<folder>
-
- filename = SubElement(top, 'filename') # 在根标签<annotation>下创建一个子标签<filename>
- filename.text = self.filename # 用self.filename的数据填充子标签<filename>
-
- localImgPath = SubElement(top, 'path') # 在根标签<annotation>下创建一个子标签<path>
- localImgPath.text = self.localImgPath # 用self.localImgPath的数据填充子标签<path>
-
- source = SubElement(top, 'source') # 在根标签<annotation>下创建一个子标签<source>
- database = SubElement(source, 'database') # 在根标签<source>下创建一个子标签<database>
- database.text = self.databaseSrc # 用self.databaseSrc的数据填充子标签<database>
-
- size_part = SubElement(top, 'size') # 在根标签<annotation>下创建一个子标签<size>
- width = SubElement(size_part, 'width') # 在根标签<size>下创建一个子标签<width>
- height = SubElement(size_part, 'height') # 在根标签<size>下创建一个子标签<height>
- depth = SubElement(size_part, 'depth') # 在根标签<size>下创建一个子标签<depth>
- width.text = str(self.imgSize[1]) # 用self.imgSize[1]的数据填充子标签<width>
- height.text = str(self.imgSize[0]) # 用self.imgSize[0]的数据填充子标签<height>
- if len(self.imgSize) == 3: # 如果图片深度为3,则用self.imgSize[2]的数据填充子标签<height>,否则用1填充
- depth.text = str(self.imgSize[2])
- else:
- depth.text = '1'
-
- segmented = SubElement(top, 'segmented')
- segmented.text = '0'
- return top
-
- def addBndBox(self, xmin, ymin, xmax, ymax, name):
- '''
- 将检测对象框坐标及其对象类别作为一个字典加入到self.boxlist中
- params:
- xmin -- 检测框的左上角的x坐标
- ymin -- 检测框的左上角的y坐标
- xmax -- 检测框的右下角的x坐标
- ymax -- 检测框的右下角的y坐标
- name -- 检测框内的对象类别名
- '''
- bndbox = {'xmin': xmin, 'ymin': ymin, 'xmax': xmax, 'ymax': ymax}
- bndbox['name'] = name
- self.boxlist.append(bndbox)
-
- def appendObjects(self, top):
- '''
- 在xml文件中加入检测框的坐标及其对象类别名
- params:
- top -- xml的根标签,以<annotation>开始
- '''
- for each_object in self.boxlist:
- object_item = SubElement(top, 'object')
- name = SubElement(object_item, 'name')
- name.text = str(each_object['name'])
- pose = SubElement(object_item, 'pose')
- pose.text = "Unspecified"
- truncated = SubElement(object_item, 'truncated')
- truncated.text = "0"
- difficult = SubElement(object_item, 'Difficult')
- difficult.text = "0"
- bndbox = SubElement(object_item, 'bndbox')
- xmin = SubElement(bndbox, 'xmin')
- xmin.text = str(each_object['xmin'])
- ymin = SubElement(bndbox, 'ymin')
- ymin.text = str(each_object['ymin'])
- xmax = SubElement(bndbox, 'xmax')
- xmax.text = str(each_object['xmax'])
- ymax = SubElement(bndbox, 'ymax')
- ymax.text = str(each_object['ymax'])
-
- def save(self, targetFile=None):
- '''
- 以美观输出的xml格式来保存xml文件
- params:
- targetFile -- 存储的xml文件名,不包括.xml部分
- '''
- root = self.genXML()
- self.appendObjects(root)
- out_file = None
- subdir = self.foldername.split('/')[-1]
- if not os.path.isdir(subdir):
- os.mkdir(subdir)
- if targetFile is None:
- with open(self.foldername + '/' + self.filename + '.xml', 'w') as out_file:
- prettifyResult = self.prettify(root)
- out_file.write(prettifyResult)
- out_file.close()
- else:
- with open(targetFile, 'w') as out_file:
- prettifyResult = self.prettify(root)
- out_file.write(prettifyResult)
- out_file.close()
-
-
- class PascalVocReader:
-
- def __init__(self, filepath):
- # shapes type:
- # [labbel, [(x1,y1), (x2,y2), (x3,y3), (x4,y4)], color, color]
- self.shapes = []
- self.filepath = filepath
- self.parseXML()
-
- def getShapes(self):
- return self.shapes
-
- def addShape(self, label, bndbox):
- xmin = int(bndbox.find('xmin').text)
- ymin = int(bndbox.find('ymin').text)
- xmax = int(bndbox.find('xmax').text)
- ymax = int(bndbox.find('ymax').text)
- points = [(xmin, ymin), (xmax, ymin), (xmax, ymax), (xmin, ymax)]
- self.shapes.append((label, points, None, None))
-
- def parseXML(self):
- assert self.filepath.endswith('.xml'), "Unsupport file format"
- parser = etree.XMLParser(encoding='utf-8')
- xmltree = ElementTree.parse(self.filepath, parser=parser).getroot()
- filename = xmltree.find('filename').text
-
- for object_iter in xmltree.findall('object'):
- bndbox = object_iter.find("bndbox")
- label = object_iter.find('name').text
- self.addShape(label, bndbox)
- return True
-
-
- def main(srcDir, dstDir):
- i = 1
- # os.walk()
- # dirName是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)
- # root所指的是当前正在遍历的这个文件夹的本身的地址
- # dirs是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
- # files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)
- for dirpath, dirnames, filenames in os.walk(srcDir):
- # print(dirpath, dirnames, filenames)
- for filepath in filenames:
- fileName = os.path.join(dirpath, filepath)
- print(fileName)
- print("processing: {}, {}".format(i, fileName))
- i = i + 1
- xmlFileName = filepath[:-5] # remove ".json" 5 character
- # 解析该json文件,返回一个列表的列表,存储了一个json文件里面的所有方框坐标及其所属的类
- objs = parseJson(str(fileName))
- # 如果存在检测对象,创建一个与该json文件具有相同名的VOC格式的xml文件
- if len(objs):
- tmp = PascalVocWriter(dstDir, xmlFileName, (720, 1280, 3), fileName)
- for obj in objs:
- tmp.addBndBox(obj[0], obj[1], obj[2], obj[3], obj[4])
- tmp.save()
- else:
- print(fileName)
-
-
- if __name__ == '__main__':
- # 这里写自己的json标签路径
- srcDir = r'D:\postgraduate\competition\dataset\bdd100k_labels\bdd100k\labels\100k\val' # 原json存放路径
- dstDir = r'D:\postgraduate\competition\dataset\bdd100k_labels\bdd100k\labels\100k\val_xml' # 转换后xml存放路径
- # srcDir = r'D:\postgraduate\competition\dataset\bdd100k_labels\bdd100k\labels\100k\train'
- # dstDir = r"D:\postgraduate\competition\dataset\bdd100k_labels\bdd100k\labels\100k\train_xml"
- main(srcDir, dstDir)
-
这是xml转txt的代码:
- # xmlToTxt
- import os
- import glob
- import xml.etree.ElementTree as ET
-
- xml_file=r'D:\postgraduate\competition\dataset\bdd100k_labels\bdd100k\labels\100k\val_xml'
-
- l=['car', 'bus', 'person', 'bike', 'truck', 'motor', 'train', 'rider', 'traffic sign', 'traffic light']
-
- def convert(box,dw,dh):
- x=(box[0]+box[2])/2.0
- y=(box[1]+box[3])/2.0
- w=box[2]-box[0]
- h=box[3]-box[1]
-
- x=x/dw
- y=y/dh
- w=w/dw
- h=h/dh
-
- return x,y,w,h
-
- def f(name_id):
- xml_o=open(r'D:\postgraduate\competition\dataset\bdd100k_labels\bdd100k\labels\100k\val_xml\%s.xml'%name_id)
- txt_o=open(r'D:\postgraduate\competition\dataset\bdd100k_labels\bdd100k\labels\100k\val_txt\%s.txt'%name_id,'w')
-
- pares=ET.parse(xml_o)
- root=pares.getroot()
- objects=root.findall('object')
- size=root.find('size')
- dw=int(size.find('width').text)
- dh=int(size.find('height').text)
-
- for obj in objects :
- c=l.index(obj.find('name').text)
- bnd=obj.find('bndbox')
-
- b=(float(bnd.find('xmin').text),float(bnd.find('ymin').text),
- float(bnd.find('xmax').text),float(bnd.find('ymax').text))
-
- x,y,w,h=convert(b,dw,dh)
-
- write_t="{} {:.5f} {:.5f} {:.5f} {:.5f}\n".format(c,x,y,w,h)
- txt_o.write(write_t)
-
- xml_o.close()
- txt_o.close()
-
- name=glob.glob(os.path.join(xml_file,"*.xml"))
- for i in name :
- name_id=os.path.basename(i)[:-4]
- f(name_id)
这是json转txt的代码:
- # jsonToTxt
- import re
- import os
- import json
-
-
- def search_file(data_dir, pattern=r'\.jpg$'):
- # 返回一个目录的绝对路径
- root_dir = os.path.abspath(data_dir)
- # print(root_dir)
- for root, dirs, files in os.walk(root_dir):
- for f in files:
- # print(f)
- # print("****************")
- if re.search(pattern, f, re.I):
- abs_path = os.path.join(root, f)
- print(abs_path)
- # print('new file %s' % absfn)
- yield abs_path
-
-
- class Bdd2yolov5:
- def __init__(self):
- self.bdd100k_width = 1280
- self.bdd100k_height = 720
- self.select_categorys = ["person", "car", "bus", "truck", 'traffic light']
- self.cat2id = {
- "person": 0,
- "car": 1,
- "bus": 1,
- "truck": 1,
- 'traffic light': 2
- }
-
- @property
- def all_categorys(self):
- return ["person", "rider", "car", "bus", "truck", "bike",
- "motor", "traffic light", "traffic sign", "train"]
-
- def _filter_by_attr(self, attr=None):
- if attr is None:
- return False
- # 过滤掉晚上的图片
- if attr['timeofday'] == 'night':
- return True
- return False
-
- def _filter_by_box(self, w, h):
- # size ratio
- # 过滤掉过于小的小目标
- threshold = 0.001
- if float(w * h) / (self.bdd100k_width * self.bdd100k_height) < threshold:
- return True
- return False
-
- def bdd2yolov5(self, path):
- lines = ""
- with open(path) as fp:
- j = json.load(fp)
- if self._filter_by_attr(j['attributes']):
- return
- for fr in j["frames"]:
- dw = 1.0 / self.bdd100k_width
- dh = 1.0 / self.bdd100k_height
- for obj in fr["objects"]:
- if obj["category"] in self.select_categorys:
- idx = self.cat2id[obj["category"]]
- cx = (obj["box2d"]["x1"] + obj["box2d"]["x2"]) / 2.0
- cy = (obj["box2d"]["y1"] + obj["box2d"]["y2"]) / 2.0
- w = obj["box2d"]["x2"] - obj["box2d"]["x1"]
- h = obj["box2d"]["y2"] - obj["box2d"]["y1"]
- if w <= 0 or h <= 0:
- continue
- if self._filter_by_box(w, h):
- continue
- # 根据图片尺寸进行归一化
- cx, cy, w, h = cx * dw, cy * dh, w * dw, h * dh
- line = f"{idx} {cx:.6f} {cy:.6f} {w:.6f} {h:.6f}\n"
- lines += line
- if len(lines) != 0:
- # 转换后的以*.txt结尾的标注文件我就直接和*.json放一具目录了
- # yolov5中用到的时候稍微挪一下就行了
- yolo_txt = path.replace(".json", ".txt")
- with open(yolo_txt, 'w') as fp2:
- fp2.writelines(lines)
- # print("%s has been dealt!" % path)
-
-
- if __name__ == "__main__":
- bdd_label_dir = "./val"
- cvt = Bdd2yolov5()
- for path in search_file(bdd_label_dir, r"\.json$"):
- cvt.bdd2yolov5(path)
使用第二种直接将json转成txt的方法时,会出现不知道哪些image被过滤掉的情况,因为在转换的时候没有用到image,所以需要用到一个找到文件名称相同但后缀不同的代码:
- # 找同名但后缀不同的文件并输出
-
- import os
- import glob
- from PIL import Image
-
- # 指定找到文件后,另存为的文件夹路径
- outDir = os.path.abspath(r'D:\postgraduate\competition\dataset\data\val\img')
-
- # 指定第一个文件夹的位置
- imageDir1 = os.path.abspath(r'D:\BaiduNetdiskDownload\BDD100K\images\bdd100k\images\100k\val')
-
- # 定义要处理的第一个文件夹变量
- image1 = [] # image1指文件夹里的文件,包括文件后缀格式;
- imgname1 = [] # imgname1指里面的文件名称,不包括文件后缀格式
-
- # 通过glob.glob来获取第一个文件夹下,所有'.jpg'文件
- imageList1 = glob.glob(os.path.join(imageDir1, '*.jpg'))
-
- # 遍历所有文件,获取文件名称(包括后缀)
- for item in imageList1:
- image1.append(os.path.basename(item))
-
- # 遍历文件名称,去除后缀,只保留名称
- for item in image1:
- (temp1, temp2) = os.path.splitext(item)
- imgname1.append(temp1)
-
- # 对于第二个文件夹路径,做同样的操作
- imageDir2 = os.path.abspath(r'D:\postgraduate\competition\dataset\data\val\label')
- image2 = []
- imgname2 = []
- imageList2 = glob.glob(os.path.join(imageDir2, '*.txt'))
-
- for item in imageList2:
- image2.append(os.path.basename(item))
-
- for item in image2:
- (temp1, temp2) = os.path.splitext(item)
- imgname2.append(temp1)
-
- # 通过遍历,获取第一个文件夹下,文件名称(不包括后缀)与第二个文件夹相同的文件,并另存在outDir文件夹下。文件名称与第一个文件夹里的文件相同,后缀格式亦保持不变。
- for item1 in imgname1:
- for item2 in imgname2:
- if item1 == item2:
- dir = imageList1[imgname1.index(item1)]
- img = Image.open(dir)
- name = os.path.basename(dir)
- img.save(os.path.join(outDir, name))
这样datasets就准备好了,目录结构是这样的:
修改train.py文件:
主要是修改parse_opt函数里面的参数:
① 修改weights:我用的是yolov5l.pt。
yolov5共有4中预训练权重,区别如下:总的来说就是模型越小,检测速度越快,检测准确度越低。
② 修改cfg:这里需要对原有的yolov5l.yaml文件做一下修改,只需要修改class的数量,我这里一共检测3个类别,所以就把nc改成3.
③ 修改data:这里需要在原有的data文件夹下新建一个yaml文件,里面要写的内容如下:
- # YOLOv5 声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/337936推荐阅读
相关标签
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。