当前位置:   article > 正文

图像检测:图像检索_图形相似度emd算法

图形相似度emd算法

相似图像检索

在这里插入图片描述

相似颜色检索

实现基于人类颜色感知的相似排序,颜色特征提取&特征相似度计算

颜色直方图就是将RGB图像中出现的颜色进行统计,将一张图像描述成一个256维度的特征向量
在这里插入图片描述

自编码器:通过神经网络进行特征提取,提取出针对学习样本的通用特征降维方法
神经网络的两端通过相同的数据限制,学习到中间的隐藏层权重,通过使用降维再升维的方法,使隐藏层输出最大限度的保存图像的主要特征,以使还原后的图像与原图像误差达到最小。

在这里插入图片描述

颜色特征提取: 目标:统计颜色成分,绘制颜色聚类直方图。方法:使用kmeans++对图片Lab像素值进行聚类。
在这里插入图片描述

颜色特征相似度计算: 颜色直方图距离:EMD(推土机距离),两张图片的颜色特征直方图之间的视觉相似度,检索结果的排序依据。色差距离:CIEDE2000,Lab空间中两个颜色之间的视觉相似度。EMD距离的基础距离。

色差距离

色差容忍度(Tolerance):概念:无法感知的色差,计算:色差小于JND(Just-Noticeable-Difference)阈值。前提:感知均匀的色差距离。
CIE1931颜色空间 :容忍椭圆,非感知均匀。
CIELab颜色空间 :视觉感知均匀的颜色模型,均匀性更好的距离CIEDE2000
在这里插入图片描述

CIE制定,用于CIE_Lab空间的色差距离
欧式距离→CIEDE1994->CIEDE2000
在这里插入图片描述
改进目标:人眼视觉的均匀性

EMD距离

两个多维特征分布之间的非相似性度量,推土机距离(Wasserstein)

传统运输问题
场景:多对多分配。物资运送:多个供应商->多个需求商户,土堆搬运:多个土堆->多个土坑
约束:双方节点总量相等,不同节点之间成本各异。
目标:完成分配的最小成本。
在这里插入图片描述

问题条件: 有三个土堆Earth_1,Earth_2,Earth_3,每个土堆都有5个单位的土量;有三个土坑Hole_1,Hole_2,Hole_3,每个土坑所能容纳的土量分别为3、7、5;不同的土堆和土坑之间的距离不同,距离值分别是1,2,3有一个搬运工,一趟只能搬运1单位的土
在这里插入图片描述

任务目标: 以最小的行走距离(EMD),将所有土堆运输到土坑处并填平。

解决方案: 最小距离(EMD):3x1 + 2x2 + 5x1 + 5x1 = 17
E1->H1:3, E1->H2:2,E2->H2:5,E3->H3:5
在这里插入图片描述

EMD距离应用到颜色相似检索
多维分布->颜色特征直方图,推土机距离->CIEDE2000

在这里插入图片描述

流程说明:

** 搜索图片的颜色特征提取**
在这里插入图片描述

图片库的颜色特征提取
在这里插入图片描述

颜色相似度(EMD)计算

在这里插入图片描述

根据相似度排序
在这里插入图片描述

相似纹理检索

纹理: 元素或基元按一定规则排列。纹理特征:反映图像中同质现象的视觉特征,所有物体表面共有的内在特征,包含了物体表面组织结构排列的重要信息。
在这里插入图片描述

算法结构:
目标:实现基于人类纹理感知的相似排序。
模块:纹理特征提取(Gabor滤波器),特征计算,特征相似度计算

Gabor滤波器组
Gabor滤波器类似于人类的生物视觉系统,多尺度,多方向。
频域:属于加窗傅里叶变换
空域:一个高斯核函数和正弦平面波的乘积。
在这里插入图片描述

频率:1,2,3,4,5,6
尺寸:25,35,49,69,97,137
8方向:0,22.5,45,67.5,90,112.5,135,157.5

在这里插入图片描述

Gabor纹理特征提取:
1,彩色图片灰度化
2,提取灰度图的Gabor滤波器特征:6频率(尺度)、8方向的Gabor,48个同尺寸的特征图,每个像素对应48维的Gabor特征向量
3,使用Kmeans++聚类所有像素Gabor特征:K值(10)根据数据集纹理复杂度而定,使用KD-tree版加速
4,Gabor卷积操作加速:FFT,采用图片尺寸缩小替代Gabor模板尺寸增大的策略
在这里插入图片描述

Gabor纹理特征提取可视化
在这里插入图片描述

相似形状检索

PHOG形状特征提取:金字塔梯度方向直方图。
网格:1X1,2X2,4X4,直方图数量:9,维数:189=(1+4+16)X9
在这里插入图片描述
在这里插入图片描述

形状特征相似度计算
1,标准化欧式距离:Si为样本集特征中每一维对应的标准差。
在这里插入图片描述

2,直方图相交(Histogram Intersection)
在这里插入图片描述
在这里插入图片描述

效果图
在这里插入图片描述

相似局部特征检索

局部特征点特征提取
检测出所有局部特征点和特征描述子
SIFT特征点:SURF,Color-SIFT,Affine-SIFT,Dense-SIFT,PCA-SIFT
在这里插入图片描述

图之间的相似度匹配
两个图SIFT点集之间的匹配胡对数,双向匹配
在这里插入图片描述
在这里插入图片描述

Bag Of Visual Word

(BoW model)忽略文本的语法和语序,用一组无序的单词( words)来表达一段文字或一个文档。近年来BoW模型被广泛应用于计算机视觉中,与应用于文本的BoW类比,图像的特征( feature)被当作单词( Word) 。
在这里插入图片描述

视觉词汇字典: 有图片集的所有视觉词汇构成,视觉词汇的物理含义不明显。不是现成的,需要构建。
特征检测:特征点(SIFT,SURF)
特征表示:SIFT描述子,颜色,纹理
字典生成:Kmeans等聚类
在这里插入图片描述
在这里插入图片描述

假设训练集有M幅图像,对训练图象集进行预处理。包括图像增强、分割,图像统一格式,统一规格等等。对每一幅图像提取若干数量的SIFT特征。每一个SIFT特征用一个128维的描述子天量表示,假设M幅图像共提取出N个SIFT特征。用K-means对上一步提取的N个SIFT特征进行聚类。聚类中心有k个(这里的聚类中心:称为视觉词),码本的长度也就为k,计算每一幅图像的每一个SIFT特征到这k个视觉词的距离,并将其映射到距离最近的视觉词中(即将该视觉词的对应词频+1) 。完成这一步后,每一幅图像就变成了一个与视觉词序列相对应的词频矢量。

SIFT视觉词汇字典的应用
利用SIFT算法提取图片集中所有视觉词汇
在这里插入图片描述

利用Kmeans算法对所有词汇聚类,收缩为字典
在这里插入图片描述

基于字典编码图片特征:词汇频数直方图,最近邻词汇,特征相似距离
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/435541
推荐阅读
相关标签
  

闽ICP备14008679号