赞
踩
要求:编程实现对图片中具体内容的颜色识别。编程语言:C++或python。判断图片的主色调是红色还是蓝色。 基础数据:组委会提供200张以上的图片作为识别训练集,比赛的200 张图片另外提供。 比赛要求:编写代码,从200张图片中随机读取20张图片,在终端中以 文字形式输出以上20张图片的主色调是红色还是蓝色。
- import numpy as np
- import cv2 as cv
- import math
- import random
- from PIL import Image, ImageDraw, ImageFont
-
- colors = {'黑色': [0, 180, 0, 255, 0, 46],
- '灰色': [0, 180, 0, 43, 46, 220],
- '白色': [0, 180, 0, 30, 221, 255],
- '红色': [0, 10, 35, 255, 46, 255],
- '橙色': [11, 25, 43, 255, 46, 255],
- '黄色': [26, 34, 43, 255, 46, 255],
- '绿色': [35, 77, 43, 255, 46, 255],
- '青色': [78, 99, 43, 255, 46, 255],
- '蓝色': [100, 124, 43, 255, 46, 255],
- '紫色': [125, 155, 43, 255, 46, 255]
- }
-
- color = ['黑色', '灰色', '白色', '红色', '橙色', '黄色', '绿色', '青色', '蓝色', '紫色']
-
-
- def cv2ImgAddText(img, text, left, top, textColor=(0, 0, 0), textSize=0):
-
- if (isinstance(img, np.ndarray)): # 判断是否OpenCV图片类型
- img = Image.fromarray(cv.cvtColor(img, cv.COLOR_BGR2RGB))
- draw = ImageDraw.Draw(img)
-
- return cv.cvtColor(np.asarray(img), cv.COLOR_RGB2BGR)
-
- # RGB颜色空间转HSV颜色空间
- def simple_rgb2hsv(r, g, b):
- r, g, b = r / 255.0, g / 255.0, b / 255.0
- mx = max(r, g, b)
- mn = min(r, g, b)
- df = mx - mn
- if mx == mn:
- h = 0
- elif mx == r:
- h = (60/360) * (((g - b) / df) % 6)
- elif mx == g:
- h = (60/360) * ((b - r) / df + 2)
- elif mx == b:
- h = (60/360) * ((r - g) / df+4)
- if mx == 0:
- s = 0
- else:
- s = df / mx
- v = mx
- h, s, v = math.ceil(h*180), math.ceil(s*255), math.ceil(v*255)
- print(f'h:{h}, s:{s}, v:{v}')
- i = 0
- for value in colors.values():
- if ((h >= 156) & (h <= 180)) & ((s >= 43) & (s <= 255)) & ((v >= 46) & (v <= 255)):
- return "红色"
- elif ((h >= value[0]) & (h <= value[1])) & ((s >= value[2]) & (s <= value[3])) & ((v >= value[4]) & (v <= value[5])):
- return color[i]
- i += 1
-
-
- # 构建图像数据
- # K-means 只能处理向量形状的数据,不能处理矩阵型数据,
- # 这里 reshape(-1, 3) 代表图片的所有像素点,而每个像素点有三个特征(即三个通道)
- def k_means(image):
- data = image.reshape((-1, 3))
- data = np.float32(data)
-
- # K-means 算法停止条件
- # 一个元组,传入 cv.kmeans(),( type, max_iter, epsilon ) type 见下面链接,max_iter 是最大迭代次数,epsilon 要达到的精度
- # https://docs.opencv.org/master/d1/d5c/tutorial_py_kmeans_opencv.html
- criteria = (cv.TERM_CRITERIA_EPS + cv.TERM_CRITERIA_MAX_ITER, 10, 1.0)
- num_clusters = 2 # 聚类的数量
- ret, label, center = cv.kmeans(data, num_clusters, None, criteria, 10, cv.KMEANS_RANDOM_CENTERS)
- # 求取所聚类的最大概率的值
- clusters = np.zeros([num_clusters], dtype=np.int32)
- for i in range(len(label)):
- clusters[label[i][0]] += 1 # 计算每个类别共有多少个
- clusters = np.float32(clusters) / float(h * w) # 计算概率
- print(clusters)
- max_data = max(clusters)
- print(max_data)
- max_num = clusters.tolist().index(max_data)
- print(max_num)
-
- # center = np.int32(center) # 因为像素值是 0-255 故对其聚类中心进行强制类型转换
- center = np.uint8(center) # 因为像素值是 0-255 故对其聚类中心进行强制类型转换
- print('this is center', center)
- # sorted(clusters) # 这里对主色按比例从大到小排序 [::-1] 代表首尾反转 如[1,2,3] -> [3, 2, 1]
- b = center[max_num][0] # 这一类对应的中心,即 RGB 三个通道的值
- g = center[max_num][1]
- r = center[max_num][2]
- print(f'r:{r}, g:{g}, b:{b}')
- main_color = simple_rgb2hsv(r, g, b)
- print(main_color + '\n')
- return main_color
-
- if __name__ == '__main__':
- for i in range(20):
- num = random.randint(1, 200)
- if num < 10:
- num_data = '00' + str(num)
- elif num < 100 and num >= 10:
- num_data = '0' + str(num)
- else:
- num_data = str(num)
- print(f'第{num_data}张图')
- # num_data = '190'
- image = cv.imdecode(np.fromfile(f'mydata/平安城市测试集/颜色识别任务1/{num_data}.jpg', dtype=np.uint8), -1)
- # image = cv.resize(image,None,fx=1,fy=1,interpolation=cv.INTER_LINEAR)
- image = cv.resize(image,(600,600))
- h, w, ch = image.shape # 读取图像的高、宽、通道数
- print(f'图像的高、宽、通道数:{image.shape}')
- image = cv2ImgAddText(image, k_means(image), 0, 0, (0, 255, 0), 50)
- cv.imshow(f'{i}', image)
- cv.waitKey(0)
- cv.destroyAllWindows()
以上就是我所运用的代码,感谢大家观看,希望有帮助到大家。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。