赞
踩
在机器学习或者深度学习的问题中,因为受制于图像采集的方式,投入的精力和图像标注的难度等,用于训练的图像数量可能非常有限。这种情况下,可能出现模型过拟合,训练后的模型泛化能力差等问题,降低模型的实际使用能力,这种现象在医学图像的深度学习中尤其常见。为了在有限的数据下得到更好的分类,检测和分割的结果,往往需要使用数据增强的方式,通过对图像的旋转,加入噪声,仿射变换等方式增加数据量。这里我们就介绍一个python中常见的数据增强库,imgaug
该数据增强库也非常容易上手,加入我们已经读取了二维的图像数据,记为images,images应该有四个维度,分别为(N,height,weidth,channels)就是图像数量,图像高度,图像宽度,图像的通道(RGB)。如果是灰度图的话,也必须为四个维度,其中channels为1。数据必须是uint8类型,大小在0到255之间。有了这个准备我们就可以对images中的图像数据进行增强了。
from imgaug import augmenters as iaa #引入数据增强的包
seq = iaa.Sequential([ #建立一个名为seq的实例,定义增强方法,用于增强
iaa.Crop(px=(0, 16)), #对图像进行crop操作,随机在距离边缘的0到16像素中选择crop范围
iaa.Fliplr(0.5), #对百分之五十的图像进行做左右翻转
iaa.GaussianBlur((0, 1.0)) #在模型上使用0均值1方差进行高斯模糊
])
images_aug = seq.augment_images(images) #应用数据增强
在上面的代码中,得到的images_aug就是数据增强之后的结果了,它就可以用来训练我们的深度学习模型或者用于其他。为了更加直观的展示数据增强的结果,我们从官网上截了如下的图像,这就是一只松鼠会被数据增强为如下的样子。
在下一章中,我们会展示一个基本包含了所有的分类问题数据增强方法的例子,之后如果要使用这个库,就可以直接复制然后删减得到适合自己数据的增强方法。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。