全参考图像质量评估

全参考图像质量评估（英语：Full Reference Image Quality Assessment, FR-IQA）是一种图像质量评估的方法，是指在拥有理想质量的参考图像的情况下，和测试图像进行比较，分析测试图像的失真程度，从而获得测试图像的质量评估结果。常用的评估方法主要基于像素统计、信号、结构。例如比较原始图像和经由JPEG压缩后图像的失真程度。

基于图像像素统计

基于图像像素统计的基础上，均方误差和峰值信噪比为两种较常使用的图像质量评估方法。

均方误差（MSE）

均方误差是去计算预测值和实际观测值间差的平方的均值。它只考虑误差的平均大小，不考虑其方向，其被定义为:

MSE={\frac {1}{mn}}\sum _{i=0}^{m-1}\sum _{j=0}^{n-1}{[I(i,j)-K(i,j)]^{2}}

I

为测试图像、

K

为参考图像，

I(i,j)

为测试图像中

pixel(i,j)

的值、

K(i,j)

为参考图像中

pixel(i,j)

的值，

m

、

n

为图像长宽的值

MSE 是衡量平均误差的简单方法， MSE 可以评估测试图像和参考图像的变化程度，MSE 的值越小，说明测试图像失真程度较低。

峰值信噪比（PSNR）

峰值信噪比是一个表示信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的工程术语。由于许多信号都有非常宽的动态范围，峰值信噪比常用对数分贝单位来表示。其利用均方误差进行定义:

PSNR=10\log _{10}{({\frac {{\rm {MAX}}_{I}^{2}}{MSE}})}=20\log _{10}{({\frac {{\rm {MAX}}_{I}}{\sqrt {MSE}}})}

其中的

MAX_{i}

为讯号的最大强度，在图像中，若每个 pixel 以 8 为表示，则最大强度即为 255。

图像压缩中典型的峰值信噪比值在 30 到 40dB 之间，PSNR 的值愈高，表示 MSE 的值愈小，说明测试图像失真程度较低。

基于信号基础

由于 MSE 和 PSNR 在某些情况下不能精确地表示图像质量，故Hamid R Sheikh和Alan Bovik等人提出了信号保真度和视觉信号保真度两种基于信号基础的算法

信号保真度（IFC）

信号保真度通过多尺度高斯混合模型（英语：Gaussian Scale Mixtures）对参考图像进行统计所得，由于参考图像在GSM模型中的系数有一定的特征，所以只需要比较测试图像在GSM模型中与参考图样在GSM模型中的共同信号，就可以得出图像质量。

IFC 主要是针对高频信号的波形特征，而人眼对高频信号敏感，对低频较不敏感。经过实验后发现 IFC 和人眼的结果非常相近

视觉信号保真度（VIF）

三维视觉环境的图像和视频都来自于自然场景（natural scene）。自然场景在所有可能的信号空间形成一个微小的子空间。VIF假设测试和参考图像之间的共享讯息与视觉品质高度相关，并采用自然场景统计（NSS）模型结合失真模型来量化这种共享讯息。与基于人类视觉系统（HVS）错误敏感度和结构测量的先前方法相比，VIF在消息理论中被使用，且不需要任何HVS或其他观察几何参数，就能产生完全参考（FR）质量评估（QA）方法；VIF也不需要任何需要优化的常数，就能与现有的QA方法相竞争。

具体来说，参考图像被建模后通过HVS通道，接着由大脑处理的随机“自然”源输出。参考图像的资讯被量化为HVS频道的输入和输出之间的相互资讯（mutual information），这是大脑可以从HVS输出中提取的最理想资讯。然后让相同的参考图像通过失真通道，并对测量进行量化。将这两个讯息组合，形成视觉质量与相对图像信息相关联的视觉信息保真度。

基于结构基础

结构相似性是一种基于结构基础上用来判断图像失真程度的方法。

自然图像是高度结构化的，也就是说在自然图像中相邻像素之间有很强的关联性，而这样的关联性承载了场景中物体的结构资讯。人类视觉系统在观看影像时已经很习惯抽取这样的结构性资讯。因此，结构相似性在图像质量评估中更符合人眼对图像质量的判断。给定两张图像 $x$ 、 $y$ ，SSIM 定义为:

SSIM(x,y)=[l(x,y)]^{\alpha }[c(x,y)]^{\beta }[s(x,y)]^{\gamma }

，其中

l(x,y)={\frac {2\mu _{x}\mu _{y}+C_{1}}{\mu _{x}^{2}+\mu _{y}^{2}+C_{1}}}

，

c(x,y)={\frac {2\sigma _{x}\sigma _{y}+C_{2}}{\sigma _{x}^{2}+\sigma _{y}^{2}+C_{2}}}

，

s(x,y)={\frac {2\sigma _{xy}+C_{3}}{\sigma _{x}\sigma _{y}+C_{3}}}

$l(x,y)$ 比较 $x$ 和 $y$ 的亮度， $c(x,y)$ 比较 $x$ 和 $y$ 的对比， $s(x,y)$ 比较 $x$ 和 $y$ 的结构。 $\alpha >0$ ， $\beta >0$ ， $\gamma >0$ ，为调整 $l(x,y)$ 、 $c(x,y)$ 、 $s(x,y)$ 的参数。

$\mu _{x}$ 和 $\mu _{y}$ 、 $\sigma _{x}$ 和 $\sigma _{y}$ 分别为 $x$ 、 $y$ 的平均值和标准差， $\sigma _{xy}$ 为 $x$ 、 $y$ 的协方差， $C_{1}$ 、 $C_{2}$ 、 $C_{3}$ 为用来维持稳定的常数

SSIM的范围为0~1 。SSIM 的值愈趋近 1 ，表示两张图像愈相似，测试图像失真程度愈低；SSIM 的值愈趋近 0，表示两张图像愈不相似，测试图像失真程度愈高。当两张图像相同时，SSIM 的值为 1。

参考资料

参见