赞
踩
压缩,一共有两种,一种是有损压缩(lossy compression),一种是无损压缩(lossless compression)。有损压缩是指把编码后的比特流重新正确还原后跟原始文件存在差异,这个差异就是“损失”;而无损压缩指的是把编码后的比特流正确还原后能得到完整的原始文件,恢复文件与原始文件中不存在差异/损失。无损压缩一般应用在重要文件传输,例如医疗资料,军事文件,这类文件不允许任何传输或者存储错误,复原后的文件必须保证100%的正确还原。而我们日常生活中一般都是有损压缩,比如网上观看的视频,收听的音乐等都是有损压缩的。
在视频压缩编码领域,绝大部分情况都是采用有损编码,比人眼感觉不到的,很难感觉到的部分索性去除,在保证画质的前提下,同时减少需要传输的数据,缩减需要用于存储的空间。但是,对于有损压缩而言,压缩率越高,压缩后的文件虽然越小,但是损失就越多,与此同时,视频的画质也随之下降。对于一个优秀的编解码器,当然是压缩率越高越好,压缩后的视频的画质越高越好。所以,对于视频压缩的评判准则就少不了。
视频的画质评价可以分为两类:以MOS测试进行评价的主观性评价和以计算PSNR的客观性评价。
客观评价是以标准的数学公式计算原视频与解码出的视频之间的差异,当今被广泛使用的评判标准是PSNR,其全称为(Peak Signal to Noise Ratio)原理是利用原视频与有损压缩后产生的损失之间的比例来判断的。公式为:
其中,MAX为视频使用的信号的最大值,如视频是8比特的话,那MAX就为255。单位是分贝(dB),MSE为均方误差(Mean Squared Error)即原始图像与解码后的重建图像之间的误差,误差越小,则表示还原后的质量越好,那PSNR就越大。
PSNR的计算仅仅适用于有损压缩,对于无损压缩,因为MSE值将为0,则除式的值将为无穷大,所以对于无损压缩,PSNR是不适用的。
为了评价一个编解码器的性能,不能仅仅靠PSNR,也需要同时考虑压缩后得到的比特流的比特率(bitrate),这样,同时将PSNR和比特率都考虑到的率失真计算就可以但此重任。率失真的计算其实可以简单地理解为编码两个视频后得到的比特流,如果PSNR相同,那么比特少的编码器则更优,如果两者使用的比特数相同,那么PSNR高的编码器则更优。
依据HEVC共同测试田间(CTC:Common Test Condition),在提交提案的时候,通常是测试22,27,32,37这4个QP,编码后,得到比特率,然后解码后,得到重建视频,与原视频相比,就可以得到PSNR,下面是用测试B影像 Kimono 进行测试得到的结果。
type | Reference Bitrate | Reference Y PSNR | Test Bitrate | Test Y PSNR |
22 | 5896.18 | 41.50 | 5234.59 | 41.52 |
27 | 2674.00 | 39.46 | 2354.27 | 39.50 |
32 | 1270.53 | 36.99 | 1150.40 | 37.03 |
37 | 616.12 | 34.46 | 580.83 | 34.70 |
视频质量不仅仅要靠客观的统计数字来进行评判,也要靠人的主观判断来进行评判,毕竟,视频最终是要给人看的,客观评价得到的结果再好,如果没有适用人类视觉系统,那么我们最终看视频的体验也是不好的。所以一个视频进行编码重建以后,组织实验员来进行人眼判断质量也是重要的。
MOS测试,Mean Opinion Score Test,组织一定数量的人,尽可能地组织不同类型的人,尽量给实验制造随机性,多样性,使实验更具有一般性,可信性。
进行客观性评价的时候,测试对象坐于显示器前,每位测试对象可以坐得有远近,方向角度有不同,尽量模仿实际生活中的人群,操作者在前方显示器上播放影像,当然,播放也是有规矩的。
上图中,按时间顺序,一共分为两个阶段,一个是左边的前期测试阶段(没有任何标注),另一个是右边的投票阶段(标注有vote),其中,T1,T3时间段均是播放影像的时间,T2,T4均是休息的时候(显示器上显示灰色)。
在测试中,一共有两种影像,一个是原始影像,没有失真的,一个是测试影像,带有失真的,上图中第一个T1和第二个T1播放同一种影像,第一个T3和第二个T3播放同一种影像,到底是原始影像还是测试影像,随机!测试者无法提前得知。
等过完前面的前期测试阶段后,在Vote阶段,被测试者们就需要对影像进行打分了(即Vote),打分的图一般采用DSCQS方式评分图。
上面就是DSCQS打分图,27,28,29,30,31是视频编号,这里可以对五组(原图+测试)视频进行打分,针对每一对,当进行到Vote阶段的时候,Vote阶段第一个T1过完,在A栏打分,Vote阶段T3过完,给B栏打分。
打分栏分为五个级别,即Excellent非常好,Good好,Fair一般般,Poor差,Bad很差五个级别,打分的时候,在每个级别对应的区域划线或者打勾即可。实验完成后后由测试者收集进行统计作为主观评判结果。更详细的流程参考 R-REC-BT.500-13-201201-I!!PDF-E.pdf
当然,主观性测试也是有它的缺点的,一来是要组织这么一群人,人工费少不了,二来,组织人来进行测试不能做到实时进行,只是用已经编码好的影像进行播放来进行测试。
Mean Square Error的缩写,表示参数估计值与参数真值之差平方的期望值,可以用来评价数据的变化程度,其值越小,说明预测模型描述实验数据就越贴近,越准确。
Root Mean Square Error 均方根误差,是MSE的平方根。RMSE和MSE其实实质是一样的,只是为了更好的表达而已,比如一些数据非常大的时候,如人口数量统计,化学分子数目的计算的时候,对MSE开方以后能更明显地辨别结果。
Mean Absolute Error 的缩写,平均绝对误差是绝对误差的平均值,能更好地反映预测值误差的实际情况.。
Standard Deviation 标准差的缩写,标准差是方差的算术平方根,能反映一个数据集的离散程度。平均数相同的两组组数据,标准差未必相同。
其中,
x
‾
\overline x
x 为所有样本的平均值。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。