赞
踩
本系列文章会深入讲解OpenCV 4(Python版)的核心技术,并提供了大量的实战案例。这是本系列文章的第2篇,主要讲解OpenCV处理图像的基本方法,主要包括读取图像、显示图像、保存图像和获取图像的属性。
像素是构成图像的基本单位。现在看图1所示的花卉图像,这幅图看着很细腻,不过将图像的白框区域放大,会看到如图2所示的效果,细腻的图像不见了,取而代之的是一个一个的小方块,每一个小方块就是一个像素。
如果从显示器的角度,像素就是显示器可以显示的最小的点。像素之所以在图2所示的图中看着像一个方块,是因为如果将图像的某个区域放大,就需要将一个像素变成多个像素,这就会造成多个相邻的像素的颜色都相同,所以看着这些像素就变成了一个个小方块。
像素本身的形状并不重要,因为显示器已经无法分辨比像素更小的单元了,因此,像素是显示器可以分辨颜色的极限。所以只需要将像素想象成一个没有面积彩色小点即可。
在访问图像的像素之前,需要先了解如何确定图像中的像素。图像中的像素是通过坐标来描述的,例如,(210,235)表示在210和235这一点上的像素。不过先别忙,OpenCV在描述坐标时与传统描述方式不同,传统的坐标描述方式是(x,y),而OpenCV的描述方式是(y,x),千万别弄混了。也就是说,如果(210,235)是OpenCV的坐标,那么表示第210行,第235列的交汇点处的像素。
下面来看一下OpenCV的坐标系,图3是一副花卉的图。OpenCV坐标系是以图像的左上角为原点,Y轴正方向向下,X轴正方向向右。这幅图的分辨率是600×400,所以如果用OpenCV坐标描述左下角像素的坐标,应该是(400,0),右下角像素的坐标是(400,600)。
不过由于Python的列表元素是从0开始的,所以左下角像素的坐标应该是(399,0),右下角像素的坐标应该是(399, 599)。
如果不想用编程的方式获取图像的某个像素的坐标和分辨率,可以用一些工具软件,例如Windows的“画图”程序(如图4所示)可以很容易获得像素坐标和分辨率,只不过像素坐标是(x,y)形式的,需要将坐标的两个值调换位置后才是OpenCV的像素坐标。用“画图”打开图像,将鼠标放到图像上,左下角黑框中是鼠标所在像素的坐标,整下方黑框内是图像的分辨率。
使用imread函数读取图像的数据后,可以使用下面的代码获得像素对应的颜色值。
- import cv2
- image = cv2.imread("flower.jpg")
- px = image[200,300] # 获取坐标(200,300)的像素值
- print(px)
执行这段代码,会输出如下的内容:
[207 142 211]
px本身是一个列表,列表中有3个元素值,分别代表B(蓝)、G(绿)和R(红)3中颜色,也就是通常说的三原色。要注意,通过这种方式获取的三原色并不是习惯上的RGB,而是BGR。通过将3种颜色按不同值(每一种颜色值的范围从0到255)组合,就会呈现出各种颜色,三原色总共可以表示16777216(256 × 256 × 256)种颜色。
如果使用imread函数读取的是彩色图像,那么图像数据是包含通道的,BGR中的B、G、R就是彩色图像的3个通道。BGR也成为色彩空间,如果改变了通道顺序,如将BGR变成RGB,那么就又形成了另外一种色彩空间。而OpenCV选择了BGR色彩空间,不过这些色彩空间可以相互转换,在后面的文章会详细介绍这部分内容。
除了一下子获取BGR三个通道的颜色值外,也可以使用下面的代码分别获取独立的B、G、R值。
- import cv2
- image = cv2.imread("images/flower.jpg")
- blue = image[200,300,0] # 获取B通道的颜色值
- green = image[200,300,1] # 获取G通道的颜色值
- red = image[200,300,2] # 获取R通道的颜色值
- print(blue, green, red) # 输出BGR通道的颜色值
运行这段代码,会输出如下内容:
- [207 142 211]
- [255 0 0]
从输出结果可以看出,像素(200,300)的BGR值已经被修改。但阅读这段代码,需要注意如下几点:
这里修改的只是内存中图像的像素值,并没有将修改结果保存到图像文件中,如果想保存修改结果,需要使用imwrite函数。
在修改像素值时,不要直接修改px的值,而是直接为image[y,x]赋值,否则修改的只是px变量的值,image[y,x]的值并未改变,如下面的代码是无法修改像素(200,300)的颜色值的。
px = [255,255,255]
说明:不管是RGB色彩空间,还是BGR色彩空间,只要R、G、B三个通道的值相等,彩色图像就变成了灰度图像,其中R = G = B = 0是纯黑色,R = G = B = 255是纯白色。
下面的代码将flower.jpg中由(120,230)、(120, 310)、(190, 230)和(190, 310)这4个点围起的矩形区域变成纯黑色,并在窗口中展示原图和修改过的图,最后将修改结果保存在flower_new.jpg文件中。
- import cv2
-
- image = cv2.imread("images/flower.jpg")
- cv2.imshow("oldimage", image) # 在窗口中显示原图像
- for i in range(120, 191): # i表示纵坐标,在区间[120,190]内取值
- for j in range(230, 311): # j表示横坐标,在区间[230, 310]内取值
- image[i, j] = [0, 0, 0] # 把区域内的所有像素都修改为黑色
- cv2.imshow("newimage", image) # 在窗口中显示修改后的图像
- cv2.imwrite("images/flower_new.jpg", image) # 保存修改结果
- cv2.waitKey()
- cv2.destroyAllWindows()
运行这段程序,会看到如图5(原图)和图6(修改后的图像)所示的效果。
同时在images目录多了一个flower_new.jpg文件,效果与图6所示的效果完全相同。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。