首页 理论教育数字视频转换:新应用局面

数字视频转换:新应用局面

【摘要】:要使计算机能够对视频进行处理,必须把视频源,即来自于电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号转换成计算机要求的数字视频形式存放在磁盘上,这个过程称为视频的数字化过程。目前,数字视频的应用已经非常广泛,并带来一个全新的应用局面。数字摄像机所拍摄的视频图像及记录的伴音使用MPEG标准进行压缩编码,记录在磁带或硬盘上,需要时通过USB和IEEE 1394接口输入计算机处理。

要使计算机能够对视频进行处理,必须把视频源,即来自于电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号转换成计算机要求的数字视频形式存放在磁盘上,这个过程称为视频的数字化过程(包括采样、量化和编码)。

数字视频克服了模拟视频的局限性,这是因为数字视频可以大大降低视频的传输和存储费用,增加交互性(数字视频可通过光纤等介质高速随机读取),带来精确再现真实情景的稳定图像。

目前,数字视频的应用已经非常广泛,并带来一个全新的应用局面。首先,包括直播卫星(DBS)、有线电视、数字电视在内的各种通信应用均需要采用数字视频;其次,VCD、DVD、数字式便携摄像机都是以MPEG视频压缩为基础的。

与模拟视频相比,数字视频具有很多优点。例如,适合于网络应用,复制和传输不会造成信号质量下降,易于编辑修改,抗干扰能力强,易于加密,可节省频率资源等。

要让计算机处理视频信息,首先要解决的是视频数字化的问题。视频数字化是将模拟视频信号进行模/数转换和颜色空间转换,转变为计算机可处理的数字信号,与音频信号数字化类似,计算机也要对输入的模拟视频信息进行采样与量化,并进行编码,使其变成数字化图像。

(1)视频信号的采样

根据电视信号的特征,亮度信号带宽是色度信号带宽的两倍。因此视频数字化时对信号的色差分量的采样率低于对亮度分量的采样率。如果用Y∶U∶V来表示Y、U、V三分量的采样比例,则数字视频的采样格式分别有4∶1∶1、4∶2∶2和4∶4∶4三种。

电视图像既是空间的函数,也是时间的函数,而且又是采用隔行扫描方式,所以其采样方式比扫描仪扫描图像的方式要复杂得多。分量采样时采集到的是隔行样本点,要把隔行样本组合成逐行样本,然后进行样本点的量化,再将YUV颜色空间转换到RGB色彩空间,最后才能得到数字视频数据。

(2)视频信号的量化

采样过程是把模拟信号变成了时间上离散的脉冲信号,量化过程则是进行幅度上的离散化处理。在时间轴的任意一点上量化后的信号电平与原模拟信号电平之间在大多数情况下总是有一定的误差,误差是不可避免的,同时也是不可逆的。由于信号的随机性,这种误差大小也是随机的。这种表现类似于随机噪声效果,具有相当宽度的频谱,因此通常又把量化误差称为量化噪声。

如果视频信号量化比特率为8位,信号就有28=256个量化值。若最大信号正好用足8位,那么小于1/256的信号就只能当作0处理了。而且每两个相邻数字的差距也必须大于1/256才能分得开,当两个原来不同的数值用同一个二进制值来表示时,实际数值与记录数值之差就成为量化噪声。所以,比特率已决定了整个系统的理想状态下的最小噪声、动态范围和信噪比,模拟信号在理想状态是没有这种限制的。亮度信号用8位量化,灰度等级最多只有256个,如果R、G、B三个色度信号都用8位量化,就可以获得256×256×256=16 777 216即近1 700万种颜色。不同的量化位数所获得的灰度等级不同。

量化位数越多,层次就分得越细,但数据量也成倍上升。每增加一位,数据量就翻一番。例如DVD播放机的视频量化位数多为10位,灰度等级达到1 024级,然而数据量是8位量化的4倍。(www.chuimin.cn)

量化的过程是不可逆的,这是因为量化本身给信号带来的损伤是不可弥补的。量化时位数选取过小不足以反映出图像的细节,位数选取过大则会产生庞大的数据率,从而占用大量的频带,给传输带来困难。降低量化误差最直接的方法就是增加量化级数、减小最小量化间隔,但由此带来数据率的增加会要求更大的处理带宽。现在一般的视频信号均采用8位、10位量化,在信号质量要求较高的情况下可采用12位量化。

(3)视频信号的压缩与编码

经采样、量化后的信号要转换成数字符号才能进行传输,这一过程称为“编码”。视频压缩编码的理论基础是信息论。信息压缩就是从时间域、空间域两方面去除冗余信息,将可推知的确定冗余信息去掉。

在通信理论中,编码分为信源编码和信道编码两大类。所谓信源编码是指将信号源中多余的信息除去,形成一个适合用来传输的信号。为了抑制信道噪声对信号的干扰,往往还需要对信号进行再编码,使接收端能够检测或纠正数据在信道传输过程中引起的错误,这称为“信道编码”。

视频编码标准主要有MPEG与H.261标准。视频编码技术主要分成帧内编码和帧间编码。前者用于去掉图像的空间冗余信息,后者用于去除图像的时间冗余信息。

视频信号的数字化过程比音频信号的数字化过程要复杂,计算机中用于视频信号数字化的硬件称为“视频采集卡”,简称“视频卡”,它能将输入的模拟视频信号(以及伴音信号)进行数字化,然后存储在硬盘中。在数字化的同时,视频图像经过颜色空间转换(由YUV转换为RGB)后与计算机图形显示卡产生的图像叠加,用户即可以在显示器上观看到视频内容。

通常,获取数字视频的同时需要数字信号处理器(DSP)进行音频和视频数据的压缩编码。当使用专用的视频播放软件打开视频文件,播放之前需要进行音频和视频数据的解压缩。图5.19是视频卡的组成及其与图形卡、主机之间的关系。

图5.19 视频卡、图形卡与主机的关系

数字摄像头也是一种在线获取数字视频的设备。数字摄像头通过光学镜头和CCD传感器采集图像,不需要视频采集卡,直接将图像转换成数字信号并输入到计算机。数字摄像头具有分辨率帧率和视角等主要技术参数。大多数的数字摄像头采用CCD感光传感器,也有些产品采用成本较低,技术参数也低的CMOS类型的光传感器,获得功耗小、速度快的优点。数字摄像头的接口一般采用USB接口,有些采用高速的IEEE 1394接口。

数字摄像机是一种离线的数字视频获取设备。其原理与数码相机类似,但功能更多。数字摄像机所拍摄的视频图像及记录的伴音使用MPEG标准进行压缩编码,记录在磁带或硬盘上,需要时通过USB和IEEE 1394接口输入计算机处理。