赞
踩
Roboflow 是yolov5到v8官方推荐的数据集查找及下载网站,一般大家都把该网站当作一个很好的存有大量开源计算机视觉项目的下载网站,并且此网站的数据集种类相比其他网站多不少。拿我举例,我毕设是做马铃薯缺陷检测的,Roboflow里的马铃薯数据集相比其他数据库如Kaggle,paperwithcode,Goole dataset search多不少。但是由于马铃薯这个方向的项目比较冷门,数据集里的质量还过得去的图片加起来也不足100张。这学期前期忙研究生复试,复试完才开始集中精力搞毕设。用Yolov5跑出来模型中期答辩时,就被老师说图片太少了,要增加。于是就打算利用数据增强的做法,将图片数量上升一个量级。
在网上搜索后,大多数博主是采用写好的python程序来对图像进行增强的,但是这种程序大部分虽说符合yolov5的格式,但是要么输出的图片格式不对,要么输出的标签文本格式不对,而且程序如果出现bug也是一件很头疼的事。和同学交流后,了解到Roboflow自带图像增强的功能,基本支持所有格式,而且效果很好。所以就将这个办法分享一下。
1:打开Roboflow官网,有VPN的用VPN,不用VPN真的很慢,基本就打不开的。没注册的点击右上角的Creat Account 跟着步骤走即可,注册完Sign in(登录),我这里已经登录了,之后进入Roboflow的Projects界面。
2:点击新建项目,按照指引对你的项目要检测的目标和项目名称命名即可。这两个名称你写啥都行,就是给项目起个名字而已,之后再点击Create Public Project即可。
3:第一次应该会提升你是否跟着引导(Guide)还是Solo(自己一个人搞就行,相当于Skip),我们选择含有Solo的那个选项,实际上你跟着引导做也行,就是稍微考验一点英语水平。现在我们选择自己做后,就会看到下面这个界面,在Upload(上传数据)界面处,我们选择Select Folder(从电脑上选择存有要上传数据的文件夹)
选择后会弹出系统的文件夹框,选择即可。 比如我要上传此images文件夹,我点击上传,网站上方会弹出一个小框问你是否同意上传,选择上传即可。
我们上传完后会看到此界面:其中All images表示你一共上传的图片,Annotated表示含有标签文本的图片,Not Annotated表示未含有标签文本的图片。我的代码路径是将图片和标签分开的,所以图片和标签不在同一文件里,如果你的在同一文件里,就会显示到Annotated里面了,下面我传一下标签文件,大家就明白了。注:传完图片后就得传标签,不能先传标签也不能传两次图片,我这么试了,反正是不行,你们也可以试试,看Roboflow有没有对此功能进行了更新。
我再次点击Select Folder选择含有标签文本的文件夹:
传完标签文本后be like:显示表明所有的图片均是有标签图片,没有Not Annotated的图片了。
4:之后点击右上角的Save and Continue,从而将这些数据集传入这个项目的dataset中,如果你传入的图片很多,那么等待的时间会比较长,反之则越少。一般等个2,3分钟就行,VPN不太行可能也得等会,不过会有进度提示的。
点击后会有一个此数据集train,valid,test的比例,你自己根据自己的需求设置就好,之后点击Continue。
之后等待上传至dataset即可,上传完成后点击dataset会出现类似如下的界面:
5:我们点击Generate
再点击Augmentation(选择数据增强方式)eg:
上面是图像级处理,下面是检测框级处理。图像增强后都会有image与labels
选择你要的增强方式,基本的增强方式基本都包括了,不太懂的话建议根据英文查一下,都很简单的。
选择增强方式时建议一次选择一两个就行,别选太多,不然增强后的图片就乱套了。
选一两种增强方式,多Generate Version几次,数据集也能上一个量级,而且数据集效果还比较好。
选好增强方式后点击5:generate,有三种免费的增强数量可选择,也够用了。看你想增加大约几倍而选择吧。
再点击下方的generate即可生成Version数据集。
6:选择Export导出数据集
选择格式。我选的是YOLOv5的安装包zip版本,推荐使用安装包zip的。你要是YOLOv7,v8的自己换FOrmat就行。
下载后解压即可,解压后be like:
利用Roboflow对数据集增强讲解结束
7:第一种形式的数据增强完成后,如果还需要其它形式的数据增强,直接对Augment(数据增强)那个选项编辑再Generate(生成新的Version)即可。
删除掉你上次选择的增强方式,添加这次想要的增强方式
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。