首页 理论教育余弦正交基简介及在音视频压缩中的应用

余弦正交基简介及在音视频压缩中的应用

【摘要】:对于长度为N的一维信号X,余弦变换定义TC为TC=CN·X 正弦正交基元素由下列函数生成:由式确定的变换称为离散余弦变换。可通过近似为整数后变换,称为整数DCT,在H.264及AVS标准中被使用。对于4阶DCT,余弦变换基等于:式中,c=2cos(π/8)和s=sin(π/8)。余弦变换主要应用在数据内插、图像压缩方面,在MPEG-2、H.264、AVS等音视频压缩标准中得到了广泛应用。

fx),x=0,1,2,…,N-1,为离散序列,按照下式延拓成偶对称序列fsx):

fsx+1/2)=fx)且fx)=f(-x-1) (4-18)

式中,x∈[-NN-1]。显然fs关于x=-1/2偶对称,如图4-2所示。

978-7-111-48233-8-Chapter04-21.jpg

图4-2 关于x=-1/2为中心的偶对称序列

x′=x+1/2,于是fsx′)是以x′=0为中心的偶对称函数,其傅里叶变换

978-7-111-48233-8-Chapter04-22.jpg

所以fs(0)=0

根据式(4-18)知fsx′)和fx)的关系如下:

fs(-x+1/2)=f(-x)=fx-1)=fsx-1/2),x∈[0,N] (4-20)

结合式(4-19)和式(4-20)可得fsx′)的傅里叶变换为

978-7-111-48233-8-Chapter04-23.jpg

由式(4-21)确定的变换称为离散余弦变换(DCT)。对于长度N的一维信号X,余弦变换定义TC

TC=CN·X (4-22)

正弦正交基元素由下列函数生成:

978-7-111-48233-8-Chapter04-24.jpg

8阶正弦变换基函数如图4-3所示。

978-7-111-48233-8-Chapter04-25.jpg

图4-38 阶正弦变换基函数

实现上述结果的MATLAB代码如下(省略画图部分):

978-7-111-48233-8-Chapter04-26.jpg

978-7-111-48233-8-Chapter04-27.jpg

对于N阶正弦变换基CN满足:

978-7-111-48233-8-Chapter04-28.jpg

式中,I是N阶单位矩阵。证明如下:

证明:若i=j=0,显然有:

978-7-111-48233-8-Chapter04-29.jpg

一般情况下,结合(4-23)得:

978-7-111-48233-8-Chapter04-30.jpg

ij≠0时,令n=(i+j)/2N,显然有0<n<1。式(4-26)中元素A

978-7-111-48233-8-Chapter04-31.jpg

同理可证,B=0;当i=j≠0时,同法可知A等于0,但显然B=N;当i=0或j=0时,结论同ij≠0情形。综合以上,可知:

978-7-111-48233-8-Chapter04-32.jpg

结合式(4-22)和式(4-24),可知余弦反变换为

X=CTN·TC (4-29)

需要指出的是,由于余弦变换基元素均为小数,在运算上较复杂。可通过近似为整数后变换,称为整数DCT,在H.264及AVS标准中被使用。对于4阶DCT,余弦变换基等于:

978-7-111-48233-8-Chapter04-33.jpg

式(4-30)中,c=2cos(π/8)和s=sin(π/8)。近似取整的方式可以通过基乘上α后作某种规则的取整,也可通过按式(4-29)进行部分运算后步骤取整。不论采用哪种方式都会引入误差,如何分析误差分布规律及有效降低误差是值得研究的问题。余弦变换主要应用在数据内插、图像压缩方面,在MPEG-2、H.264、AVS等音视频压缩标准中得到了广泛应用。