python labelImg xml 格式的数据集解析及可视化_用python将把用labelimg标记出来的框框转换成中点的坐标、制作计数数据集

作者：笔触狂放9 | 2024-02-16 12:17:12

踩

用python将把用labelimg标记出来的框框转换成中点的坐标、制作计数数据集

1、XML 格式分析

需要关注的一般只有：
filename ：图片名称
size：width，heights 图片尺寸
object：图片中标注的目标，可能含有多个目标，这个xml就有2个标注目标
----- name：标注目标类别标签 labels
----- bndbox ：标注目标框 xmin ,ymin ,xmax ,ymax （左上角，右下角坐标）
在这里插入图片描述

2、可视化：把 xml 中的目标框在原图上绘制出来，并显示标签

原作者代码


import xml.etree.ElementTree as ET # 读取xml。
import os
from PIL import Image,ImageDraw,ImageFont
 
def parse_rec(filename): 
	tree = ET.parse(filename) # 解析读取xml函数
	objects = []
	img_dir =[]
	for xml_name in tree.findall('filename'):
		img_path = os.path.join(pic_path, xml_name.text)
		img_dir.append(img_path)
	for obj in tree.findall('object'):
		obj_struct = {}
		obj_struct['name'] = obj.find('name').text
		obj_struct['pose'] = obj.find('pose').text
		obj_struct['truncated'] = int(obj.find('truncated').text)
		obj_struct['difficult'] = int(obj.find('difficult').text)
		bbox = obj.find('bndbox')
		obj_struct['bbox'] = [int(bbox.find('xmin').text),
							  int(bbox.find('ymin').text),
							  int(bbox.find('xmax').text),
							  int(bbox.find('ymax').text)]
		objects.append(obj_struct)
	
	return objects,img_dir
# 可视化
def visualise_gt(objects,img_dir): 
	for id,img_path in enumerate(img_dir):
		img = Image.open(img_path)
		draw = ImageDraw.Draw(img)
		for a in objects:
			xmin =int(a['bbox'][0])
			ymin =int(a['bbox'][1])
			xmax =int(a['bbox'][2])
			ymax =int(a['bbox'][3])
			label = a['name']
			draw.rectangle((xmin,ymin,xmax,ymax), fill=None, outline=(0,255,0),width=2)
			draw.text((xmin-10,ymin-15), label, fill = (0,255,0),font=font)  # 利用ImageDraw的内置函数，在图片上写入文字
		img.show()
	
 
 
fontPath = "C:\Windows\Fonts\Consolas\consola.ttf" # 字体路径
root = 'F:/dataset/AQM'
ann_path = os.path.join(root, 'Annotations')  # xml文件所在路径
pic_path = os.path.join(root, 'JPEGImages')  # 样本图片路径
font = ImageFont.truetype(fontPath, 16)
 
for filename in os.listdir(ann_path):
	xml_path = os.path.join(ann_path,filename)
	object,img_dir = parse_rec(xml_path)
	visualise_gt(object,img_dir )

根据我的任务编写的代码


#!/usr/bin/python
# -*- coding: UTF-8 -*-
#功能：根据原图和XML文件中的框，截取图片
import sys
import os
import cv2 as cv
from tqdm import tqdm
try:
    import xml.etree.cElementTree as ET
except ImportError:
    import xml.etree.ElementInclude as ET
 
root = "E:\\ProjectAll\\OCLE\\DatasetOriginal\\casing_cap\\casing_cap_missing"
ann_path = os.path.join(root,'Annotations') #xml文件路径
pic_path = os.path.join(root,'JPEGImages') #样本图片路径
save_path_root = "E:\\ProjectAll\\OCLE\\DatasetExtraction\\casing_cap" #图片保存路径
process_name = 'casing_cap' #定义要处理的部件，以调用不同的处理函数
 
def Crop_image(pic_name, img_path, label, x0, y0, x1, y1):
    img = cv.imread(img_path)
    img_crop = img[y0:y1, x0:x1] #第一个是y方向取值，第二个是x方向取值
    save_path = os.path.join(save_path_root, label)
    img_new_name = (pic_name[0:7]+'_'+str(x0)+'.jpg')
    save_name = os.path.join(save_path, img_new_name)
    print(save_name)
    cv.imwrite(save_name, img_crop)
 
def split_pin_find(tree): #开口销处理函数
    for xml_name in tree.findall('filename'):
        pic_name = xml_name.text
        img_path = os.path.join(pic_path, pic_name)
        for obj in tree.findall('object'): #遍历所有object
            label = obj.find('name').text
            bbox = obj.find('bndbox')
            if label == 'split_pin_loose':
                x0 = int(bbox.find('xmin').text)
                y0 = int(bbox.find('ymin').text)
                x1 = int(bbox.find('xmax').text)
                y1 = int(bbox.find('ymax').text)
                Crop_image(pic_name, img_path, label, x0, y0, x1, y1)
            elif label == 'split_pin_missing':
                x0 = int(bbox.find('xmin').text)
                y0 = int(bbox.find('ymin').text)
                x1 = int(bbox.find('xmax').text)
                y1 = int(bbox.find('ymax').text)
                Crop_image(pic_name, img_path, label, x0, y0, x1, y1)
            elif label == 'split_pin_normal':
                x0 = int(bbox.find('xmin').text)
                y0 = int(bbox.find('ymin').text)
                x1 = int(bbox.find('xmax').text)
                y1 = int(bbox.find('ymax').text)
                Crop_image(pic_name, img_path, label, x0, y0, x1, y1)
            else:
                x0 = int(bbox.find('xmin').text)
                y0 = int(bbox.find('ymin').text)
                x1 = int(bbox.find('xmax').text)
                y1 = int(bbox.find('ymax').text)
                label = 'split_pin_otherside'
                Crop_image(pic_name, img_path, label, x0, y0, x1, y1)
 
def casing_cap_find(tree): #管帽处理函数
    for xml_name in tree.findall('filename'):
        pic_name = xml_name.text
        img_path = os.path.join(pic_path, pic_name)
        for obj in tree.findall('object'): #遍历所有object
            label = obj.find('name').text
            bbox = obj.find('bndbox')
            if label == 'casing_cap_loose':
                x0 = int(bbox.find('xmin').text)
                y0 = int(bbox.find('ymin').text)
                x1 = int(bbox.find('xmax').text)
                y1 = int(bbox.find('ymax').text)
                Crop_image(pic_name, img_path, label, x0, y0, x1, y1)
            elif label == 'casing_cap_missing':
                x0 = int(bbox.find('xmin').text)
                y0 = int(bbox.find('ymin').text)
                x1 = int(bbox.find('xmax').text)
                y1 = int(bbox.find('ymax').text)
                Crop_image(pic_name, img_path, label, x0, y0, x1, y1)
            else:
                x0 = int(bbox.find('xmin').text)
                y0 = int(bbox.find('ymin').text)
                x1 = int(bbox.find('xmax').text)
                y1 = int(bbox.find('ymax').text)
                label = 'casing_cap_normal'
                Crop_image(pic_name, img_path, label, x0, y0, x1, y1)
 
def parse_rec(filename):
    tree = ET.parse(filename)
    if process_name == 'split_pin':
        split_pin_find(tree)
    elif process_name == 'casing_cap':
        casing_cap_find(tree)
 
def main():
    for filename in tqdm(os.listdir(ann_path)):
        xml_path = os.path.join(ann_path, filename)
        parse_rec(xml_path)
 
if __name__ == '__main__':
    main()

3、对 xml 及进行操作的重要函数

官方手册
 xml.etree.ElementTree 资料
 Elements and Element Trees

XML是一种固有的分层数据格式，最自然的表示方法是使用树，其内元素称作子节点

通过 parse() 解析xml文本，返回根元素 tree。（一级节点Annotation）
通过对 tree 进行findall操作，可到到带有指定标签的节点（二级节点eg：filename，object）。

Element对象有以下常用属性：
1、.tag: 标签
2、.text: 去除标签，获得标签中的内容。
3、.attrib: 获取标签中的属性和属性值。
4、.findall() : 只找到带有标签的所有节点
5、.append() : 增加新节点
6、.set()：增加或者修改属性
7、.remove()：删除节点

保存xml文件： ElementTree.write()

xml.dom.minidom，另一种xml的解析方式

参考：python xml 格式的数据集标注文件解析（修改、保存、删除），可视化：https://blog.csdn.net/qq_36758461/article/details/103947168?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/blog/article/detail/93127

python labelImg xml 格式的数据集解析及可视化_用python将把用labelimg标记出来的框框转换成中点的坐标、制作计数数据集

1、XML 格式分析

2、可视化：把 xml 中的目标框在原图上绘制出来，并显示标签

原作者代码

根据我的任务编写的代码

3、对 xml 及进行操作的重要函数

dnn+yolo+flask推理（树莓派实时推流—内含YOLO全家桶系列）_web python 上传视频流 yolo

不修改代码页，解决 Python 报错 LookupError: unknown encoding: 65001_python runtime state: core initialized lookuperror

【Python】 “'conda' 不是内部或外部命令，也不是可运行的程序或批处理文件。”(未“Add to Path”安装)_conda activate pytorch 'conda' 不是内部或外部命令,也不是可运行的程序

python system函数工作_python – 为什么“echo os.system(‘/ bin / bash’)”工作？

Python asyncio高性能异步编程详解

7个学妹看见都惊呆的 Python 小项目！【附源码】

7个惊艳众人的 Python 实用项目！【附源码】

无需GPU，一键搭建本地大语言模型(LLM)服务，提供 OpenAI 接口 | 附 C#/Python 代码_大模型本地搭建

新手友好！101 个 Python 小项目源码（推荐收藏）_python小项目源代码

python diango_Django首页、文档和下载 - Python Web 框架 - OSCHINA - 中文开源技术交流社区...

Python Django Web开发实战（详细教程）

Python web实战 | 使用 Django 搭建 Web 应用程序【干货】_django框架web实例

Python Django Web开发实战_django快速开发实战

我用 Python 做了一个轻松爬取各大网站文章并输出为 Markdown 的工具！_网页文章爬取工具

【python 爬虫】博客文章转 Markdown（支持 LaTeX 公式）_python爬虫将文章保存为markdown

我用 Python 做了一个轻松爬取各大网站文章并输出为 Markdown 的工具！_爬取网站文章

python julia go_一键把你的 Java ,Go, PHP , Node/JavaScript, Python , Ruby, Julia 函数变成一个服务...

python 做服务程序_windows平台把python程序制作成windows服务并开机启动（实践的坑）...

python——开发2022年过年烟花小程序_龙年春节python

集五福（python）_python 集五福

python labelImg xml 格式的数据集解析及可视化_用python将把用labelimg标记出来的框框转换成中点的坐标、制作计数数据集

1、XML 格式分析

2、可视化：把 xml 中的目标框在原图上绘制出来 ，并显示标签

原作者代码

根据我的任务编写的代码

3、对 xml 及进行操作的重要函数

2、可视化：把 xml 中的目标框在原图上绘制出来，并显示标签