当前位置:   article > 正文

YOLOv5超详细的入门级教程(训练篇)(四)——利用远程服务器训练模型_vs 远程训练yolov5

vs 远程训练yolov5

我是一个非常懒蛋的人,如果不记录博客的话,遇到一点点问题就不想解决了。
感觉记录博客可以很好的帮助我缕清思路,更好的解决问题,而且未来遇到同样的问题时还可以查看之前的博客,何乐而不为呢?

修改train.py文件

我看许多人也会写一个==shell脚本来进行训练(方便日后操作),简单理解起见,我们就直接修改train.py的default设定就好了。
看了一下学校的卡是2080ti,batchsize我们先设定为8,因为用的是voc2007,imgsize设定为513X513,不行的话咱再改。epoch设定为300
在这里插入图片描述

进行训练

1.传文件到服务器

  • 首先要先给文件打个包,发现压缩数据集的时候太慢了一张一张的压缩,下次把数据集放在服务器那边,做一个整理。
    在这里插入图片描述
    还挺大的。。大多数都是数据集
  • 传文件到服务器
    scp -r /path/filename username@servername:/path/
    好了出现了一个问题:scp传输大文件出现stalled
    原因:scp 会占用最大的带宽,如果有防火墙的话,就会有网络的开关延迟,造成TCP stalled
    解决方法:让scp 的传输速度小于你的带宽。
    比如,题主的(http://blog.mreald.com/108)的带宽是4M的,最多就500K(4000Kb/8),让其传输速度为250K左右就没事了(2000/8):
    scp -l 2000 192.157.226.242:/root/drupal*.tgz .
    but我的电脑带宽绝对够大啊
    在这里插入图片描述
    很无奈,先传着试试看,每次都是500k/s的速度上下浮动,也太慢了。。(好生气。。我一定要有自己的卡和机子。。)
    在这里插入图片描述
    在这里插入图片描述
  • 经过了40分钟终于传好了。写完了另外一篇博客。
    在这里插入图片描述

2.环境配置与进行训练

  1. 解压压缩包
unzip yolov5.zip -d /home/dp/NWQ/yolo
  • 1

在这里插入图片描述

  1. 运行一下train.py试试看
  • 发现啥环境也没有,
pip install -r requirements.txt
  • 1

在这里插入图片描述

  • 也太舒适了。。。快的起飞
  1. 发现我的那几个文件用的都是,绝对路径,放在ubuntu下报错了。
    在这里插入图片描述
  2. 改一下voc2yolo.py的代码
vim voc2yolo.py
  • 1
  • i进入insert模式
    把win的\改成ubuntu的/。
    我也是醉了。

在这里插入图片描述

  • :wq保存并退出

出现的问题

  1. 运行之后是这个样子,非常迅速
    在这里插入图片描述
  2. 愉快的进行了一轮训练后,突然报了找不到图片的错
    在这里插入图片描述
    在这里插入图片描述
  • 我估计是voc.yaml文件的问题 里面没有加测试集,所以ap没有跑出来
    在voc.yaml中加入
test: data/2007_test.txt
  • 1

即可。

  • 但是不对劲啊,这怎么是命名的问题。。我想一想哪里没有改

解决方法:删除了所有的数据缓存和文件,重新运行voc2yolo.py,重新建立数据路径文件。
我觉得大概率是缓存文件的问题。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/202036
推荐阅读
相关标签
  

闽ICP备14008679号