赞
踩
1)opencv 默认读进去的是bgr的顺序,下面操作将bgr转为rgb
mg = cv2.resize(img, (config.input_size[1], config.input_size[0]))
img = img[:, :, (2, 1, 0)]//将bgr转rgb
2)opencv读入图片的矩阵格式是:(height,width,channels)。而在深度学习中,因为要对不同通道应用卷积,所以会采取另一种方式,channel first:(channels,height,width)。为了应对该要求,可以这么做:
print(img.shape)
img = img.transpose(2,0,1)
print(img.shape)
3)在深度学习搭建CNN时,往往要做相应的图像数据处理,比如图像要扩展维度,比如扩展成(batch_size,channels,height,width)。对于这种要求,可以这么做:
#有时候还要扩展维度,比如有时候我们需要预测单张图片,要在要加一列做图片的个数,可以这么做:
img = np.expand_dims(img, axis=0)
print(img.shape)
注意:
上面提到的是预测阶段时预测单张图片的扩展维度的操作,如果是训练阶段,构建batch,即得到这种形式:(batch_size,channels,height,width)。可以这么做:
data_list = []
loop:
im = cv2.imread('xxx.png')
data_list.append(im)
data_arr = np.array(data_list)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。