数字视频编码简介

2023-06-21 理论教育版权反馈

【摘要】：为了能够有效地存储和传输数字视频信号，必须采用数据压缩编码技术来降低数据量。图像与视频压缩编码方法就是要尽可能地去除这些冗余，以减少用于表示图像与视频信息所需的数据量。图4-2 数据压缩编码方法的分类无失真编码无失真编码又称无损编码、信息保持编码、熵编码。

1.数字视频压缩的必要性和可能性

视频信号数字化之后所面临的一个问题是巨大的数据量给存储和传输带来的压力。为了能够有效地存储和传输数字视频信号，必须采用数据压缩编码技术来降低数据量。

数字视频压缩原理主要来自两个方面：一是数字视频数据中存在着大量的数据冗余，二是人眼的视觉系统特性也带来了较大的视觉冗余。视频数据的这些冗余为压缩编码提供了依据。因此图像和视频数据压缩不仅是必要的，而且也是可能的。

在一般的图像和视频数据中，主要存在以下几种形式的冗余：

1）空间冗余：也称为空域冗余，是一种由图像内部相邻像素之间存在较强的相关性所造成的冗余。

2）时间冗余：也称为时域冗余，它是针对视频序列而言的，是一种由视频序列中的相邻帧之间的相关性造成的冗余。

3）统计冗余：也称编码表示冗余或符号冗余。

4）结构冗余：在图像的部分区域内存在着很相似的纹理结构，或是图像的各个部分之间存在着自相似性。

5）视觉冗余。人眼的视觉系统对图像的感知是非均匀和非线性的，虽然在视频的压缩编解码过程中引入了误差，但是并不一定都被人眼所察觉出来。那些包含在色度信号、图像高频信号和运动图像中的数据，并不能对增加图像的清晰度作出贡献，而被认为是多余的，我们称之为视觉冗余。

上述各种形式的冗余，是压缩图像与视频数据的出发点。图像与视频压缩编码方法就是要尽可能地去除这些冗余，以减少用于表示图像与视频信息所需的数据量。

2.数据压缩编码方法的分类

从不同的角度出发有不同的分类方法。

从信息论的角度出发，根据解码后还原的数据是否与原始数据完全相同，可将数据压缩方法分为两大类：无失真编码和限失真编码，如图4-2所示。

图4-2 数据压缩编码方法的分类

（1）无失真编码

无失真编码又称无损编码、信息保持编码、熵编码。它是一类基于信号统计特性的编码方法，利用信源概率分布的不均匀性，通过变长编码来减少信源数据冗余，解码后还原的数据与压缩编码前的原始数据完全相同而不引入任何失真。最常用的无失真编码方法有哈夫曼（Huffman）编码、算术编码和游程编码等。

（2）限失真编码

限失真编码也称有损编码、非信息保持编码、熵压缩编码。也就是说，解码后还原的数据与压缩编码前的原始数据是有差别的，编码会造成一定程度的失真。

限失真编码方法利用了人类视觉的感知特性，允许压缩过程中损失一部分信息，虽然在解码时不能完全恢复原始数据，但是如果把失真控制在视觉阈值以下或控制在可容忍的限度内，则不会影响人们对图像的理解，却换来了高压缩比。在限失真编码中，允许的失真越大，则可达到的压缩比越高。

常见的限失真编码方法有：预测编码、变换编码、矢量量化、基于模型的编码等。

在实际应用的编码中，往往采用混合编码方法，即综合利用上述各种编码技术，以求达到最佳压缩编码效果。以MPEG标准中视频压缩算法为例，它就是综合利用了变换编码、运动补偿、帧间预测以及熵编码等多项技术。