当前位置:   article > 正文

转化成txt文件_json转txt

json转txt

第一种方法

  1. # 处理同一个数据集下多个json文件时,仅运行一次class_txt即可
  2. import json
  3. import os
  4. "存储标签与预测框到txt文件中"
  5. def json_txt(json_path, txt_path):
  6. "json_path: 需要处理的json文件的路径"
  7. "txt_path: 将json文件处理后txt文件存放的文件夹名"
  8. # 生成存放json文件的路径
  9. if not os.path.exists(txt_path):
  10. os.mkdir(txt_path)
  11. # 读取json文件
  12. with open(json_path, 'r') as f:
  13. dict = json.load(f)
  14. # 得到images和annotations信息
  15. images_value = dict.get("images") # 得到某个键下对应的值
  16. annotations_value = dict.get("annotations") # 得到某个键下对应的值
  17. # 使用images下的图像名的id创建txt文件
  18. list=[] # 将文件名存储在list中
  19. for i in images_value:
  20. open(txt_path + str(i.get("id")) + '.txt', 'w')
  21. #open(txt_path + str(i.get("file_name")) + '.txt', 'w')
  22. list.append(i.get("id"))
  23. # 将id对应图片的bbox写入txt文件中
  24. for i in list:
  25. for j in annotations_value:
  26. if j.get("image_id") == i:
  27. # bbox标签归一化处理
  28. num = sum(j.get('bbox'))
  29. new_list = [round(m / num, 6) for m in j.get('bbox')] # 保留六位小数
  30. with open(txt_path + str(i) + '.txt', 'a') as file1: # 写入txt文件中
  31. #print(j.get("category_id"), new_list[0], new_list[1], new_list[2], new_list[3], file=file1) #Json文件中categories的id是从1开始的,而YOLOV5的要求标签是从0开始的,所以需要进行一个“-1”的操作。
  32. print(j.get("category_id") - 1, new_list[0], new_list[1], new_list[2], new_list[3], file=file1) #修改后的
  33. "将id对应的标签存储在class.txt中"
  34. def class_txt(json_path, class_txt_path):
  35. "json_path: 需要处理的json文件的路径"
  36. "txt_path: 将json文件处理后存放所需的txt文件名"
  37. # 生成存放json文件的路径
  38. with open(json_path, 'r') as f:
  39. dict = json.load(f)
  40. # 得到categories下对应的信息
  41. categories_value = dict.get("categories") # 得到某个键下对应的值
  42. # 将每个类别id与类别写入txt文件中
  43. with open(class_txt_path, 'a') as file0:
  44. for i in categories_value:
  45. print(i.get("id"), i.get('name'), file=file0)
  46. json_txt("instances_test.json", "test_annotations/")
  47. # class_txt("eval.json", "id_categories.txt")

1.Json文件中categories的id是从1开始的,而YOLOV5的要求标签是从0开始的,所以需要进行一个“-1”的操作。

2.避免了图片名称和txt文件名称不一致的问题。

3.如果直接利用bbox里面的值则会造成误差偏大,所以需要对bbox里的值进行归一化处理。 

另一个方法~这个适合文件名为图片名的!

  1. #处理同一个数据集下多个json文件时,仅运行一次class_txt即可
  2. import json
  3. import os
  4. "存储标签与预测框到txt文件中"
  5. def json_txt(json_path, txt_path):
  6. "json_path: 需要处理的json文件的路径"
  7. "txt_path: 将json文件处理后txt文件存放的文件夹名"
  8. #生成存放json文件的路径
  9. if not os.path.exists(txt_path):
  10. os.mkdir(txt_path)
  11. # 读取json文件
  12. with open(json_path, 'r') as f:
  13. dict = json.load(f)
  14. # 得到images和annotations信息
  15. images_value = dict.get("images") # 得到某个键下对应的值
  16. annotations_value = dict.get("annotations") # 得到某个键下对应的值
  17. # 使用images下的图像名的id创建txt文件
  18. #nano_path = './images/train'
  19. #need_path = './labels/train/'
  20. nano_path = './images/test'
  21. need_path = './labels/test/'
  22. dir = os.listdir(nano_path)
  23. for i in dir:
  24. file_name = os.path.basename(i)
  25. file_name1 = file_name.split('.')[0]
  26. print(file_name1)
  27. open(need_path + file_name1 + '.txt', 'w')
  28. for i in images_value:
  29. open(txt_path + str(i.get("id")) + '.txt', 'w')
  30. #将id对应图片的bbox写入txt文件中
  31. print(len(images_value))
  32. for i in images_value:
  33. a = i.get('id')
  34. b = i.get('file_name')
  35. d = b.split('.')[0]
  36. for j in annotations_value:
  37. if j.get("image_id") == a:
  38. #bbox标签归一化处理
  39. num = sum(j.get('bbox'))
  40. new_list = [round(i / num, 6) for i in j.get('bbox')] # 保留六位小数
  41. with open(need_path + str(d) + '.txt', 'a') as file1: # 写入txt文件中
  42. print(j.get("category_id")-1, new_list[0], new_list[1], new_list[2], new_list[3], file=file1)
  43. "将id对应的标签存储在class.txt中"
  44. def class_txt(json_path, class_txt_path):
  45. "json_path: 需要处理的json文件的路径"
  46. "txt_path: 将json文件处理后存放所需的txt文件名"
  47. # 生成存放json文件的路径
  48. with open(json_path, 'r') as f:
  49. dict = json.load(f)
  50. # 得到categories下对应的信息
  51. categories_value = dict.get("categories") # 得到某个键下对应的值
  52. # 将每个类别id与类别写入txt文件中
  53. with open(class_txt_path, 'a') as file0:
  54. for i in categories_value:
  55. print(i.get("id"), i.get('name'), file=file0)
  56. json_txt("instances_test.json", "test_img/")
  57. json_txt('instances_train.json', 'train_img/')
  58. #class_txt("eval.json", "class.txt")

这次主要遇到了两个坑,一个是图片名称和txt文件名称不一致,另外一个是标签的类别要从0开始。

查看标签种类labels

  1. import os
  2. from pycocotools.coco import COCO
  3. from PIL import Image, ImageDraw
  4. import matplotlib.pyplot as plt
  5. json_path = "instances_train.json"
  6. #img_path = "E:\Pycharm\PycharmProjects\datasets\DUO\images\train"
  7. # load coco data
  8. coco = COCO(annotation_file=json_path)
  9. # get all image index info
  10. ids = list(sorted(coco.imgs.keys()))
  11. print("number of images: {}".format(len(ids)))
  12. # get all coco class labels
  13. coco_classes = dict([(v["id"], v["name"]) for k, v in coco.cats.items()])
  14. print("classes: {}".format(coco_classes))
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/364128
推荐阅读
相关标签
  

闽ICP备14008679号