赞
踩
根据图像的灰度、颜色、空间纹理、几何形状等特征,将图像划分成若干个互不相交的区域的过程。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V4dwG7IQ-1636795729944)(C:\Users\lenovo\AppData\Roaming\Typora\typora-user-images\image-20211108094552258.png)]
具有共同特征的目标列在一起
关键问题在于如何描述目标的共同特性
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V2ouo3qe-1636795729950)(图片/OWZ54MEF`UO]IJ$@2A.png)
基本思想:用一个或几个灰度阈值(也称灰度门限值)将图像的灰度级范围分成几个部分,然后将每个像素的灰度值和阈值相比较,根据比较结果把像素归类——前景目标物体或背景。
利用灰度直方图确定阈值
该方法适用于目标物体与背景分别占据不同灰度级范围的图像。此时图像的灰度直方图呈明显的双峰特征(分别对应背景和目标物体),或呈明显的多峰特征(分别对应背景和多个目标物体)。可以在两峰之间的谷底区域选取一个灰度值作为阈值,进行分割。
图像二值化
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EcpVWYRZ-1636795729952)(图片/image-20211108110725047.png)]
note:由于噪声及光照影响,给阈值的选择增加了复杂性
如果将直方图的包络线看成一条曲线,则通过求取曲线的极小值的方法可以找到直方图的低谷点,作为分割阈值。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Td2Kue8e-1636795729953)(图片/image-20211108111843087.png)]
在求极小值点之前,若对直方图进行平滑处理,则效果会更好。例如3点平滑,平滑后的灰度级i的相对频数用灰度级i-1,i,i+1的相对频数的平均值代替。
大律法Ostu(最大类间方差法确定阈值)
它与类内方差最小准则是等价的
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-s2McbP7A-1636795729955)(图片/image-20211109142210667.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GA5eZXDT-1636795729956)(图片/image-20211109173916731.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SqVrfXIP-1636795729957)(图片/image-20211109173928803.png)]
图像目标与背景在直方图上对应的两个波峰陡峭、对称且双峰之间有较深的波谷或双峰相距很远。
借助像素领域的局部性质(如像素的梯度值与拉普拉斯值)来确定阈值。
图像噪声等因素的影响会使得图像直方图双峰之间的波谷被填充或者双峰距离很近。此外,当图像目标与背景面积差别很大时,在直方图上表现的就是较小的一方被较大的一方淹没。——单峰。
直方图变换法
直方图变换法利用的是像素的某种局部性质,将原来的直方图变换成具有更深波谷的直方图,或者使波谷变换成双峰,使得谷点或峰点更容易检测到。
根据像素的梯度值或灰度级的平均梯度做出一个加权直方图。
散射图也可以看作一个二维直方图,其横轴表示灰度值,纵轴表示某种局部性质(如梯度),图中各点的数值是同时具有某个灰度值与梯度值的像素个数。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TgUO5DpM-1636795729958)(图片/image-20211110141130465.png)]
只取实际散射图左下角128x32大小的区域并放大三倍,其他部分均为黑色。散射图中某点的颜色越亮,表示图像中同时具有该点的坐标对应的灰度值和梯度值的像素越多。**散射图中有两个接近横轴且沿横轴相互分开的较大的亮色聚类,分别对应目标与背景的内部像素。离横轴稍远的地方有一些较暗的点,位于两个亮色聚类之间,它们对应目标与背景边界上的像素点。如果图像中存在噪声,则它们在散射图中位于离横轴较远的地方。**如果在散射图中将两个聚类分开,根据每个聚类的灰度值和梯度值就可以实现图像的分割。
由于光照不均匀等因素的影响,图像背景的灰度值并不恒定,目标与背景的对比度在图像中也会有变化,图像中还可能存在不同的阴影。无法使用单一的全局阈值对整幅图像进行分割,可以将整幅图像分解成一系列子图像,对不同的子图像使用不同的阈值进行分割。这种与像素坐标有关的阈值就称为动态阈值或自适应阈值。子图像之间可以部分重叠,也可以只相邻。
一种动态阈值方法基本步骤:
基本思想:把具有相似性质的像素逐渐结合起来生成区域
基本步骤:
对要分割的区域确定一个或多个元素(种子元素)作为生长的起点;
根据灰度、颜色、纹理或梯度等特性,确定生长过程中使用的一个相似性准则;
从种子像素开始向外扩张:首先以种子像素构成一个当前集合,然后不断将与当前集合中各个像素连通的(4连通或8连通)、并满足相似性准则的像素加入到当前集合中。最后直到不再有满足条件的新像素加入到当前集合为止,即再没有可接受的领域像素时停止生长。
note:按照4领域和8领域生长,结果有所不同。
按照8领域进行生长能够得到较精确的结果
总结步骤:
基本思想:按照某种一致性准则,不断地分裂或合并区域。
note:区域生长和区域分裂两种分割方法的异同
当一个区域不满足一致性准则时,将其分裂成大小相等且互不重叠的四个子区域。当任意两个区域满足一致性准则时,可将其合并为一个大区域。
通常是先区域分裂,再区域合并,也可以分裂和合并同时进行,最后得到图像的分割结果。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-35WHc40M-1636795729959)(图片/image-20211110173324383.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ejX1ddFD-1636795729960)(图片/image-20211110174939064.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3DQiEovk-1636795729961)(图片/image-20211110180055736.png)]
可利用各种微分算子运算进行边缘检测,基于微分运算的各种图像锐化算法都可用于图像边缘检测。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kRkPSQfi-1636795729962)(图片/image-20211110180541250.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kBIgvNg4-1636795729962)(图片/image-20211110180653543.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OTMrGGZe-1636795729964)(图片/image-20211110184023789.png)]
实现基本需要四个步骤:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UY2G8SpK-1636795729964)(图片/image-20211110191356574.png)]
轮廓提取和轮廓跟踪的目的都是为了获取目标区域的外部轮廓特征,为形状分析和目标识别做准备。
基本原理:设一副二值图像(背景为白,前景目标物体为黑),从上到下,从左到右依次扫描图像中的每个像素,若当前像素为黑(0),并且它的8邻域像素也都为黑,说明该像素是目标物体内部点,则将该像素置为白(1)。对所有像素都执行以上操作,便可提取出前景目标物体的轮廓。
轮廓跟踪就是通过顺序找出边缘点来跟踪边界的。
若图像是二值图像或不同区域具有不同的像素值,但每个区域内的像素值是相同的,基于4连通或8连通区域的轮廓跟踪算法:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lWhuGonO-1636795729966)(图片/image-20211110203134272.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iBpis8Je-1636795729966)(图片/image-20211110204340416.png)]
边界链码:链码是对边界点的一种编码表示方法,其特点是利用一系列具有特定长度和方向的相连的直线段来表示目标的边界。因为每个线段的长度固定而方向数目有限,所以只有边界的起点需要用绝对坐标表示,其余点都可以只用接续方向来代表偏移量。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IxlzKsJs-1636795729967)(图片/image-20211110210410772.png)]
什么是模板匹配?
常用的模板匹配测度:
模板图像与原图像上对应区域的误差平方和。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4RamGH24-1636795729968)(图片/image-20211110211437613.png)]
上式展开得:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dYGFVoRA-1636795729968)(图片/image-20211110211604747.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-g7cmWE6N-1636795729969)(图片/image-20211110211812678.png)]
模板匹配过程:
设原图像f(x,y)与模板图像t(j,k)的原点重合(都在左上角)。
模板图像在原图像上从左到右从上到下移动,对原图像中的任何一个位置(x,y)都可计算出一个匹配测度R(x,y)。
当R(x,y)取最大值时,此时的(x,y)指出了原图像中与模板图像的最佳匹配位置。
从该位置开始在原图像中提取与模板图像大小相同(JxK)的区域,则是最终的匹配结果。
模板匹配法的特点:
用归一化互相关求图像匹配,计算量很大。匹配过程中模板图像要在(M-J+1)x(N-K+1)个参考位置上计算归一化互相关。
模板匹配法的局限性:由于模板图像只能在原图像上平行移动,若原图像中要匹配的目标发生旋转或大小变化,则该方法无法完成匹配。
什么是图像几何变换
是指使用户设计的原始图像,能够按照需要,产生大小、形状和位置的几何变换。
图像几何变换的实质
图像几何变换不是改变图像的像素值,而是改变像素所在的几何位置。
图像几何变换的应用
图像几何变换分类
齐次坐标
二维图像几何变换矩阵
将图像上所有像素点,按照水平方向和垂直方向给定的偏移量(为整数)移动,平移后图像上的每个像素点都可以在原图像中找到对应像素点。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EkOEuJ2S-1636795729971)(图片/image-20211111121025070.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OA1FrdaC-1636795729972)(图片/image-20211111121441337.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7I97rh92-1636795729973)(图片/image-20211111122258152.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BIEMWMTY-1636795729974)(图片/image-20211111123025855.png)]
解决办法:四舍五入取整、平移处理
解决思路:
可采用某种填补方法填充空洞点——插值法
最简单的插值处理方法:行插值(或列差值)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-p0hg8sZV-1636795729976)(图片/image-20211111154517853.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4rlO4rH6-1636795729976)(图片/image-20211111154629549.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tvb8fnW9-1636795729977)(图片/image-20211111155025352.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xIQzIab4-1636795729978)(图片/image-20211111155140423.png)]
出现的问题:经过比例缩放后,新图像中的像素点可能在原图像中找不到相对应的像素点
解决方法:灰度插值处理
最邻近插值法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VXocI0D1-1636795729979)(图片/image-20211111155648390.png)]
双线性插值法
从信息处理角度来看,图像缩小是从多个信息中选出所需要的信息,而图像放大则是对多出来的空位填入适当的值,是信息的估计。
图像比例放大的实现:
图像大比例放大时的马赛克效应?
双线性插值法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7RUo6Cu7-1636795729980)(图片/image-20211111162359976.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yLUoRDCi-1636795729981)(图片/image-20211111163414701.png)]
灰度级插值处理可采用如下两种方法。
第一,可以把几何变换想象成将输入图像的灰度一个一个像素地转移到输出图像中。如果一个输入图像被映射到四个输出像素之间的位置,则其灰度值就按插值算法在四个输出像素之间进行分配。把这种灰度级插值处理称为像素移交或称为向前映射法。
第二,像素填充或向后映射法。在这种算法中,输出像素一次一个地映射到原始(输入)图像中,以便确定其灰度级。如果一个输出像素被映射到四个输出像素之间,则其灰度值由灰度级插值决定。向后空间变换是向前变换的逆变换。
为了提高双线性插值的速度,双线性插值也可以分解成三个线性插值来实现,公式如下:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eqJ5xUaA-1636795729981)(图片/image-20211112100043556.png)]
图像的复合变换是指对给定的图像连续施行若干次如前所述的平移、镜像、比例、旋转等基本变换后所完成的变换,图像的复合变换又叫级联变换。图像复合变换的矩阵T可以表示为:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TdQ8MQvX-1636795729982)(图片/image-20211112105502256.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LdepZKTI-1636795729983)(图片/image-20211112105734904.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hIPQ4MKI-1636795729984)(图片/image-20211112105834066.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HcuoHuba-1636795729984)(图片/image-20211112105902237.png)]
把三维物体或对象转变为二维图形的过程称为投影变换。根据视点(投影中心)与投影平面之间距离的不同,投影可分为平行投影和透视投影,透视投影即透视变换。
平行投影的视点与投影平面之间的距离为无穷大,而对透视投影(变换),该距离是有限的。这个距离决定着透视投影的特性——透视缩短效应。即三维物体或对象透视投影的大小与形体到视点的距离成反比。例如,等长的两直线段,都平行于投影面,但离投影中心近的线段,其透视投影大,而离投影中心远的线段,透视投影小。这种效应所产生的视觉效果与照相机系统和人的视觉系统十分类似。与平行投影相比,透视投影的深度感更强,看上去更真实,但透视投影不能真实地反映物体的精确尺寸和形状。
投影变换:把空间三维立体投射到投影面上得到二维平面图形的过程。
几个相关概念:
投影变换的实质是:从三维物体模型到二维图形描述的转换过程。
透视投影属于中心投影,它比轴测图更富有立体感和真实感。这种投影是将投影面置于投影中心与投影对象之间。
灭点:对于透视投影,一束平行于投影面的平行线的投影可保持平行,而不平行于投影面的平行线会汇聚到一个点,这个点被称为灭点。灭点可以看作是无限远处的一点在投影面上的投影,透视投影的灭点可以有无限多个,不同方向的平行线在投影面上就能形成不同的灭点,坐标轴方向的平行线在投影面上形成的灭点又称作主灭点。因为有X,Y,Z三个坐标轴,所以主灭点最多有3个。透视投影是按主灭点的个数来分类的,即按投影面与坐标轴的夹角来分类的,可分为一点透视,二点透视,三点透视。
变换矩阵[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dzMyH9eM-1636795729985)(图片/image-20211112141429689.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UtFrkfOK-1636795729987)(图片/image-20211112141637470.png)]
虽然表示图像需要大量的数据,但图像数据是高度相关的,或者说存在冗余信息,去掉这些冗余信息后,可有效压缩图像。
图像压缩的必要性
图像压缩的可能性
组成图像的各像素之间,存在着一定的相关性——空间冗余(像素间冗余)
视频图像序列中的不同帧之间的相关性所造成的冗余——时间冗余
人眼不能感知或不敏感的那部分图像信息——视觉冗余
如果图像的灰度级在编码时用的编码符号个数多于表示灰度级实际所需要的编码符号个数,则称图像包含——编码冗余
图像的灰度级通常直接用二进制编码表示。此时,编码符号数可以看成是
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jaCljls8-1636795729988)(图片/image-20211112152351196.png)]
图像中存在很强的纹理结构或自相似性——结构冗余
在有些图像中还包含有某些先验知识有关的信息——知识冗余
图像数据的这些冗余信息为图像压缩编码提供了依据;信息论观点,去除冗余信息,节省存储和传输开销;某些场合,允许一定限度的失真压缩,更进一步提高压缩比。
根据编码过程中是否存在信息损耗可将图像编码分为无损压缩和有损压缩
根据编码原理可以将图像编码分为熵编码、预测编码、变换编码和混合编码等。
根据对压缩编码后的图像进行重建的准确程度,可将常用的图像编码分为信息保持编码、保真度编码、特征提取。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5lGlcIHH-1636795729988)(图片/image-20211112162611286.png)]
eg.利用人工神经网络的压缩编码、分形编码、小波编码、基于对象的压缩编码和基于模型的压缩编码。
分形编码
小波编码
模型编码
四个参数:算法的编码效率、编码图像的质量、算法的适用范围、算法的复杂度
算法的编码效率
衡量图像编码效率的指标主要有平均码字长度(L)、压缩比(Cr)、编码效率(η)。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eR24V61F-1636795729989)(图片/image-20211112174231157.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-trZR1IKE-1636795729990)(图片/image-20211112174259700.png)]
同一个压缩算法对不同图像的编码效率不同,通常会选用一些“标准图像”,通过测量不同压缩算法对**同一组“标准图像”**的编码性能来评价压缩算法的编码效率。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-F1dau62x-1636795729990)(图片/image-20211112195921732.png)]
主观质量评价是指由一批观察者对编码图像进行观察并打分,然后综合所有人的评判结果,给出图像的质量评价。
通过向一些观察者显示解压缩图像,观察后对图像质量进行打分评判,最后对所有人的评判结果进行平均,得出图像的质量评价。
评分 | 评价 | 说明 |
---|---|---|
5 | 优秀 | 图像质量非常好,同期望的一样 |
4 | 良好 | 图像质量高,观看舒服,有干扰但不影响观看 |
3 | 可用 | 图像质量可接受,有干扰但不太影响观看 |
2 | 刚可看 | 图像质量差,干扰有些妨碍观看,希望改进 |
1 | 差 | 图像质量很差,干扰严重妨碍观看 |
0 | 不能用 | 图像质量极差,不能使用 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WU6XZbQB-1636795729991)(图片/image-20211112201942247.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-E1mkwurh-1636795729991)(图片/image-20211112202821983.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SglX7VRf-1636795729992)(图片/image-20211112203108182.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lsyvBfVB-1636795729992)(图片/image-20211112203145931.png)]
信源编码器用于减少或消除原始图像中数据冗余
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zVJj1G5B-1636795729993)(图片/image-20211112203348507.png)]
信源解码器
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-B8tJJfLS-1636795729994)(图片/image-20211112203528582.png)]
思考:为什么没有反向量化器?
因为量化过程导致了不可逆的信息损失,所以通常在信源解码器中不包含反向量化器。
无损压缩的必要性:
无损压缩编码主要针对以下两种数据冗余:
几种典型的无损压缩编码方法:
哈夫曼编码的理论基础
当平均码长R大于等于图像熵H时,总可设计出一种无失真编码。
当平均码长远大于图像熵时,表明该编码方法效率低;当平均码长等于或很接近于(但不大于)图像熵时,称此编码为最佳编码,此时不会引起图像失真;当平均码长大于图像熵时,压缩比较高,但会引起图像失真。在变长编码中,如果码字长度严格按照对应符号出现的概率大小逆序排列,则其平均码字长度为最小,这就是变长最佳编码定理,是哈夫曼编码的理论基础。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-I46JgFV7-1636795729994)(图片/image-20211112214534971.png)]
一种无损的统计编码方法,与信源符号出现的概率有关
基本思想:
哈夫曼编码是一种变长编码。
把最短的码字赋予出现概率最大的信源符号
用变长的码使冗余量达到最小,用一颗二叉树来编码,常出现的字符用较短的码表示,不常出现的字符用较长的码来表示。
使得最终的平均码字长度最小。
寻找平均码长最短的一种编码方法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ga0oGFZF-1636795729995)(图片/image-20211112220426597.png)]
Huffman编码得出的码字不唯一:
Haffman编码得到的码字不等长,但平均码字长度最小,编码效率高。
由于码字变化大,长短不一,硬件实现困难。
Huffman编码依赖于信源符号的统计特性,编码效率与信源符号的概率分布密切相关。
基本思想:
香农—范诺编码也是一种变长编码。
其编码的理论基础是:信源符号的码字长度Bk由该信源符号出现的概率决定,即:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-g0FoZakz-1636795729996)(图片/image-20211113091412558.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oWN8Bnhb-1636795729996)(图片/image-20211113091512358.png)]
香农—范诺编码算法步骤:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mjli6JIW-1636795729997)(图片/image-20211113092127167.png)]
将信源符号按其出现概率从大到小排序
将符号分成两组,使两组符号的概率和尽可能接近,将第1组标0,第2组标1
重复步骤2,直到每组只有一个符号
将每个符号所属组的值依此串起来,即可得到各个符号的香农—范诺编码
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LlfwhgDH-1636795729998)(图片/image-20211113095122238.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2pv5qf4n-1636795729999)(图片/image-20211113105949294.png)]
与信源符号出现的概率无关
LZW编码的基本思想:
LZW编码算法的关键点:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0ocQHL7V-1636795729999)(图片/image-20211113170852247.png)]
在这里插入图片描述
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。