当前位置:   article > 正文

YOLOv9最详细教程(训练自己数据集、结构介绍、重点代码讲解)(草履虫都能看懂系列)

yolov9

目录(方便查找自己所需)

1、YOLOv9介绍

2、yolov9模型图​编辑

3、前提所需

4、yolov9模型、权重下载

5、环境配置

1.下载yolov9所需虚拟环境

​2.下载yolov9所需库

3.下载pytorch

6、pycharm添加解释器

7、数据集制作

9、项目结构(选看,可跳过)

总体项目一览

yolo.py

.yaml文件

10、训练


1、YOLOv9介绍

YOLOv9 是一种用于实时目标检测的深度学习模型,是由 Joseph Redmon 和 Alexey Bochkovskiy 等人共同开发的。它是 YOLO 系列中的最新版本(现在yolov10已出),采用了一种基于骨干网络的轻量化设计,能够在保持检测准确性的同时提高检测速度,适合应用于实时场景。

2、yolov9模型图

3、前提所需

anaconda3、pycharm下载完成(最好不要最新版本,也不要太旧,本人使用2021.3)

4、yolov9模型、权重下载

1.模型下载:​​github模型代码下载

2.模型权重下载(非必须)yolov9模型下载相同位置,往下翻

位置通常放models文件下

5、环境配置

5.1.下载yolov9所需虚拟环境

打开anaconda prompt

cd进入你下载的yolov9文件夹中

创建yolov9环境:输入 conda create -n yolov9(代表环境名称)python=3.8(使用Python的版本),按y+回车

conda create -n yolov9 python=3.8

进入你刚安装的yolov9环境:conda activate yolov9(你的环境名称)

conda activate yolov9

进入后()会变成你环境名称 (判断是否安装成功)

5.2.下载yolov9依赖库

加清华端会下载更快,建议加清华端口

  1. //不加清华源
  2. pip install -r requirements.txt
  1. //加清华源
  2. pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

只要中间不报错即为下载成功

5.3.下载CUDA,cuDNN

cuda和cuDNN是连接GPU和模型训练的桥梁,pytorch是进入桥梁那段上坡的路(CPU训练慢,GPU快还好)

(最好选择在虚拟环境安装,以下介绍为虚拟机安装过程)

查看cuda最高支持版本,win+R,输入cmd,打开命令窗口,输入nvidia-smi.exe,红框位置为最大可支持安装版本

CUDA,cuDNN一般安装较低版本比较稳定,不会发疯

推荐安装CUDA11.0和cuDNN,进入环境,找到模型文件夹,ctrl+c,v(代码直接复制粘贴即可)

  1. # 安装CUDA # 指定版本
  2. conda install cudatoolkit=11.0
  3. # 安装cudnn,
  4. 如果不指定版本,在安装CUDA之后,会自动匹配对应版本的cudnn安装 # 指定版本
  5. conda install cudnn=7.3

这里是指定搜索包的路径,速度会更快

  1. # 安装CUDA
  2. conda install cudatoolkit=11.0 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/linux-64/
  3. # 安装cudnn
  4. conda install cudnn=7.3 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/linux-64/

个别需要高版本的CUDA,这里也补充上(如:yolov10)

  1. # 安装CUDA # 指定版本
  2. conda install cudatoolkit=11.7
  3. # 安装cudnn,如果不指定版本,在安装CUDA之后,会自动匹配对应版本的cudnn安装 # 指定版本
  4. conda install cudnn=8.5

5.4.下载pytorch

cuda和cuDNN是连接GPU和模型训练的桥梁,pytorch是进入桥梁那段上坡的路(pytorch库必须和cuda版本匹配)(其实这个在之前下载yolov9虚拟环境已经下载过了,但是为了确保你的pytorch版本和CUDA版本一致,所以这里在从下一遍以确保环境没有问题)

无脑复制(CUDA 11.0)Y+回车

conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=11.0 -c pytorch

无脑复制(CUDA 11.7)Y+回车

conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.7 -c pytorch -c nvidia

或者去pytorch官网查找

从下载的yolov9文件中去查看所需要的最低版本号

找到requirements.txt,可以看到是最低需要1.7.0版本

然后找到最低的pytorch版本号和对应的cuda版本,复制下面的代码

5.5检测是否安装正确(环境已经配好添加好了,6搞完)

建立cuda.py

  1. import torch
  2. print('CUDA版本:',torch.version.cuda)
  3. print('Pytorch版本:',torch.__version__)
  4. print('显卡是否可用:','可用' if(torch.cuda.is_available()) else '不可用')
  5. print('显卡数量:',torch.cuda.device_count())
  6. print('当前显卡型号:',torch.cuda.get_device_name())
  7. print('当前显卡的CUDA算力:',torch.cuda.get_device_capability())
  8. print('当前显卡的总显存:',torch.cuda.get_device_properties(0).total_memory/1024/1024/1024,'GB')
  9. print('是否支持TensorCore:','支持' if (torch.cuda.get_device_properties(0).major >= 7) else '不支持')
  10. print('当前显卡的显存使用率:',torch.cuda.memory_allocated(0)/torch.cuda.get_device_properties(0).total_memory*100,'%')

6、pycharm添加解释器

点击文件、设置

找到python解释器,添加新的解释器

找到conda环境、使用现有环境,找到你前面配置的yolov9(环境名称)

点击应用

7、数据集制作

最终结构图

在yolo9-main文件夹中创建datasets(数据文件夹),fish(你要训练的数据),Annotations(json文件),images(原图),lables(txt文件)ImageSets(数据集分组),效果如下:

在datasets(数据文件夹)创建xmltotxt.py用于将xml转化为txt文件,复制粘贴即可,需修改转化的类别名称,源文件地址和转化后文件地址(最好使用绝对路径)

  1. import xml.etree.ElementTree as ET
  2. import pickle
  3. import os
  4. from os import listdir, getcwd
  5. from os.path import join
  6. def convert(size, box):
  7. # size=(width, height) b=(xmin, xmax, ymin, ymax)
  8. # x_center = (xmax+xmin)/2 y_center = (ymax+ymin)/2
  9. # x = x_center / width y = y_center / height
  10. # w = (xmax-xmin) / width h = (ymax-ymin) / height
  11. x_center = (box[0] + box[1]) / 2.0
  12. y_center = (box[2] + box[3]) / 2.0
  13. x = x_center / size[0]
  14. y = y_center / size[1]
  15. w = (box[1] - box[0]) / size[0]
  16. h = (box[3] - box[2]) / size[1]
  17. # print(x, y, w, h)
  18. return (x, y, w, h)
  19. def convert_annotation(xml_files_path, save_txt_files_path, classes):
  20. xml_files = os.listdir(xml_files_path)
  21. # print(xml_files)
  22. for xml_name in xml_files:
  23. # print(xml_name)
  24. xml_file = os.path.join(xml_files_path, xml_name)
  25. out_txt_path = os.path.join(save_txt_files_path, xml_name.split('.')[0] + '.txt')
  26. out_txt_f = open(out_txt_path, 'w')
  27. tree = ET.parse(xml_file)
  28. root = tree.getroot()
  29. size = root.find('size')
  30. w = int(size.find('width').text)
  31. h = int(size.find('height').text)
  32. for obj in root.iter('object'):
  33. difficult = obj.find('difficult').text
  34. cls = obj.find('name').text
  35. if cls not in classes or int(difficult) == 1:
  36. continue
  37. cls_id = classes.index(cls)
  38. xmlbox = obj.find('bndbox')
  39. b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
  40. float(xmlbox.find('ymax').text))
  41. # b=(xmin, xmax, ymin, ymax)
  42. # print(w, h, b)
  43. bb = convert((w, h), b)
  44. out_txt_f.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
  45. if __name__ == "__main__":
  46. # 把forklift_pallet的voc的xml标签文件转化为yolo的txt标签文件
  47. # 1、需要转化的类别
  48. classes = ['fish']
  49. # 2、voc格式的xml标签文件路径
  50. xml_files1 = r'D:\TestMain\yolov9-main\datasets\fish\Annotations'
  51. # 3、转化为yolo格式的txt标签文件存储路径
  52. save_txt_files1 = r'D:\TestMain\yolov9-main\datasets\fish\lables'
  53. convert_annotation(xml_files1, save_txt_files1, classes)

在datasets(数据文件夹)建立splitDataset.py,用于数据集分组[训练集:验证集:测试集(7:2:1)](可修改),需修改分组数据位置(即ImageSets位置),图片存放位置,txt文件存放位置(最好使用绝对路径)

  1. import os, shutil, random
  2. from tqdm import tqdm
  3. """
  4. 标注文件是yolo格式(txt文件)
  5. 训练集:验证集:测试集 (7:2:1)
  6. """
  7. def split_img(img_path, label_path, split_list):
  8. try:
  9. Data = 'D:/TestMain/yolov9-main/datasets/fish/ImageSets'
  10. # Data是你要将要创建的文件夹路径(路径一定是相对于你当前的这个脚本而言的)
  11. # os.mkdir(Data)
  12. train_img_dir = Data + '/images/train'
  13. val_img_dir = Data + '/images/val'
  14. test_img_dir = Data + '/images/test'
  15. train_label_dir = Data + '/labels/train'
  16. val_label_dir = Data + '/labels/val'
  17. test_label_dir = Data + '/labels/test'
  18. # 创建文件夹
  19. os.makedirs(train_img_dir)
  20. os.makedirs(train_label_dir)
  21. os.makedirs(val_img_dir)
  22. os.makedirs(val_label_dir)
  23. os.makedirs(test_img_dir)
  24. os.makedirs(test_label_dir)
  25. except:
  26. print('文件目录已存在')
  27. train, val, test = split_list
  28. all_img = os.listdir(img_path)
  29. all_img_path = [os.path.join(img_path, img) for img in all_img]
  30. # all_label = os.listdir(label_path)
  31. # all_label_path = [os.path.join(label_path, label) for label in all_label]
  32. train_img = random.sample(all_img_path, int(train * len(all_img_path)))
  33. train_img_copy = [os.path.join(train_img_dir, img.split('\\')[-1]) for img in train_img]
  34. train_label = [toLabelPath(img, label_path) for img in train_img]
  35. train_label_copy = [os.path.join(train_label_dir, label.split('\\')[-1]) for label in train_label]
  36. for i in tqdm(range(len(train_img)), desc='train ', ncols=80, unit='img'):
  37. _copy(train_img[i], train_img_dir)
  38. _copy(train_label[i], train_label_dir)
  39. all_img_path.remove(train_img[i])
  40. val_img = random.sample(all_img_path, int(val / (val + test) * len(all_img_path)))
  41. val_label = [toLabelPath(img, label_path) for img in val_img]
  42. for i in tqdm(range(len(val_img)), desc='val ', ncols=80, unit='img'):
  43. _copy(val_img[i], val_img_dir)
  44. _copy(val_label[i], val_label_dir)
  45. all_img_path.remove(val_img[i])
  46. test_img = all_img_path
  47. test_label = [toLabelPath(img, label_path) for img in test_img]
  48. for i in tqdm(range(len(test_img)), desc='test ', ncols=80, unit='img'):
  49. _copy(test_img[i], test_img_dir)
  50. _copy(test_label[i], test_label_dir)
  51. def _copy(from_path, to_path):
  52. shutil.copy(from_path, to_path)
  53. def toLabelPath(img_path, label_path):
  54. img = img_path.split('\\')[-1]
  55. label = img.split('.jpg')[0] + '.txt'
  56. return os.path.join(label_path, label)
  57. if __name__ == '__main__':
  58. img_path = 'D:\TestMain\yolov9-main\datasets\\fish\images' # 你的图片存放的路径(路径一定是相对于你当前的这个脚本文件而言的)
  59. label_path = 'D:\TestMain\yolov9-main\datasets\\fish\lables' # 你的txt文件存放的路径(路径一定是相对于你当前的这个脚本文件而言的)
  60. split_list = [0.7, 0.2, 0.1] # 数据集划分比例[train:val:test]
  61. split_img(img_path, label_path, split_list)

分组完成

在data文件夹中创建data.yaml文件,需要改train,val,test文件对应的路径(最好使用绝对路径)

  1. #path: D:/TestMain/yolov9-main/datasets/fish # dataset root dir
  2. train: D:\TestMain\yolov9-main\datasets\fish1\ImageSets\images\train # train images (relative to 'path') 118287 images
  3. val: D:\TestMain\yolov9-main\datasets\fish1\ImageSets\images\val # val images (relative to 'path') 5000 images
  4. test: D:\TestMain\yolov9-main\datasets\fish1\ImageSets\images\test # 20288 of 40670 images, submit to https://competitions.codalab.org/competitions/20794
  5. # Classes
  6. names:
  7. 0: fish
  8. #放你数据集类型对应的类别,多个就0,1,2,3往后排
  9. # stuff names
  10. stuff_names: [
  11. 'fish',
  12. # other
  13. 'other',
  14. # unlabeled
  15. 'unlabeled'
  16. ]
  17. # Download script/URL (optional)
  18. download: |
  19. from utils.general import download, Path
  20. # Download labels
  21. #segments = True # segment or box labels
  22. #dir = Path(yaml['path']) # dataset root dir
  23. #url = 'https://github.com/WongKinYiu/yolov7/releases/download/v0.1/'
  24. #urls = [url + ('coco2017labels-segments.zip' if segments else 'coco2017labels.zip')] # labels
  25. #download(urls, dir=dir.parent)
  26. # Download data
  27. #urls = ['http://images.cocodataset.org/zips/train2017.zip', # 19G, 118k images
  28. # 'http://images.cocodataset.org/zips/val2017.zip', # 1G, 5k images
  29. # 'http://images.cocodataset.org/zips/test2017.zip'] # 7G, 41k images (optional)
  30. #download(urls, dir=dir / 'images', threads=3)

8、项目结构(选看,可跳过)

总体项目一览

yolo.py

yolo.py单独运行,给出训练模型的网络

.yaml文件

[-1,1,conv,[64,6,2,2]]

第一个参数为来源层数

第二个参数为卷积次数

第三个参数为卷积名称

第四个参数为卷积[输出通道层数,卷积大小(为ture/false,是否有残差卷积),步长,padding(如为空则和原图一样大)]

输入通道数对应一个卷积有几个通道,有多少卷积对应输出有多少通道

[[-1,4],1,concat,[1]]

第一个参数为来源层数

第二个参数为卷积次数

第三个参数为卷积名称

第四个参数为维度

[-1, 1, nn.Upsample, [None, 2, 'nearest']]

第一个参数为来源层数

第二个参数为卷积次数

第三个参数为卷积名称

第四个参数为[输出图像尺寸,缩放比例,插值方式](其中一个二是必须有一个为none,因为都是对输出图片的大小进行确定,否则起冲突,报错)

[[31, 34, 37, 16, 19, 22], 1, DualDDetect, [nc]]

第一个参数为来源层数

第二个参数为卷积次数

第三个参数为卷积名称

第四个参数为类别,图片标记类别fish标记

9、训练

挑选合适的训练文件和训练模型,本人选择是train_dual.py和yolov9-c.yaml

需修改(最好为绝对路径,多仔细看看)

预训练权重(yolov9-c-converted.pt(权重文件)位置,无可以不填)

模型文件(yolov9-c.yaml(模型文件)位置)

训练图片(data.yaml文件所在位置)

训练轮次(基本为300)

训练所放图片个数(8/16,看自己电脑量力而行)

训练存储地址和名称(可不改)

点击运行,万事大吉

觉得好的就点点赞,点点收藏,有什么意见或者建议都可以提(字码错了也可以说,毕竟经常这样),谢谢

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/985942
推荐阅读
相关标签
  

闽ICP备14008679号