视讯压缩图像类型

在典型的视讯压缩设计中,可以看到三种主要的图像类型有:节点图像Intra pictures)、预测图像Predicted pictures)和前后预测图像Bi-predictive picturesBi-directional pictures)。以上三者也常称作I画格I frames)、P画格P frames)和B画格B frames)。在较旧的资料中,使用的是“双向”(bi-directional),而非“前后预测”(bi-predictive)。

在视讯压缩格式中,如ITU-T VCEGISO/IEC MPEG视讯标准,通常指编码图像之间的差异处。例如,在一个场景中,有个人走过一个固定的背景,只有移动范围才需要描述(使用运动补偿、影像资料或二者的结合,取决于何者以较少的位元充分的表现出图像)。场景的部分没有改变,而无须再次传送资料。

画格类型

 
各式的画格

严格来说,图像picture)是比画格frame)更为广泛的术语,因为图像可以指画格(frame)或区域(field)。画格是某一瞬间所截取下的影像,而区域是影像每一行线的集合。如果视讯是以交错扫瞄来传送的话,通常会采用各别区域对图像编码,而不会对完整画格进行编码。尽管有时实际指的是更为广泛的“图像”(picture),通俗口语也常使用“画格”(frame)来指“图像”。

图像通常会被切割成几个宏区块macroblock),而且可以宏区块为基准来选择特定的预测类型,而非整个图像都使用同样的类型:

  • I图像(Intra-coded pictures)只可含有节点宏区块,就像传统的将一张张图片作压缩。
  • P图像(Predictive pictures)可含有节点宏区块或预测宏区块,相对于之前的画格(frame),编码器不用记录下P-frame中没有改变的pixel
  • B图像(Bi-predictive pictures)可含有节点、预测和前后预测宏区块

此外,较新的视讯编解码标准H.264,其图像可分割成更小的范围,称为切片slice),并以此取代宏区块的作用。编码器可对特定的切片选择预测类型。H.264还建议:

  • SI-画格/片(转换I);促进编码串流之间的转换;含有SI宏区块(特殊类型的节点编码宏区块)。
  • SP-画格/片(转换P);促进编码串流之间的转换;含有P和/或I宏区块。
  • 多画格运动估计(multi-frame motion estimation,可多达32参考画格)

多画格运动估计可提升相同压缩率下的品质,且SI-格、SP-格(定义为延伸profile)可增强对错误的承受能力。如此一来,较聪明的解码器就能够恢复受损的DVD串流。

节点图像

  • 图像的编解码不涉及自己以外的任何图像。
  • 可由编码器建立随机存取点(使解码器可在其它图像点上适当的进行解码)。
  • 当要呈现不同的影像细节时,也会产生I图像。
  • 与其它图像类型相比,节点图像通常需要更多位元进行编码。

I图像(I-画格)常用于随机存取,并作为其它图像的解码参考。每半秒一次的节点更新周期主要应用于数位电视广播和DVD媒体。在某些环境下可使用较长的更新周期,如视讯会议系统很少传送I图像。

预测图像

  • 需要先前图像以进行解码。
  • 可包含影像资料、运动向量移位和组合。
  • 可按解码顺序参考前一图像。
  • 较旧的标准(如MPEG-2),在解码期间,仅使用一个先前解码图像作为参考,且显示顺序要在P图像之前。
  • H.264在解码期间,可使用多个先前解码图像作为参考,且可具有任意的显示顺序关系。
  • 通常只需要比I图像还要少的位元进行编码。

前后预测图像

  • 需要先前图像以进行解码。
  • 可包含影像资料、运动向量移位和组合。
  • 包含一些针对运动范围的预测模式(如,宏区块或较小的区域),以两个不同的先前解码参考范围取得平均预测。
  • 较旧的标准(如MPEG-2)不使用B图像作为其它图像的预测参考。B图像可用于较低品质的编码,因为遗失的细节将不会损害到随后图像的预测品质。
  • H.264可使用B图像作为其它图像解码的参考(由编码器判断)。
  • 较旧的标准(如MPEG-2)使用两个先前解码的图像作为参考,并要求其中一个图像的显示顺序要在B图像之前,且另一个在之后。
  • H.264可使用一个、两个或两个以上的先前解码图像作为参考,且可具有任意的显示顺序关系。
  • 通常只需要比I或P图像还要少的位元进行编码。

参见

外部链接