首页 理论教育话音压缩编码技术,IP电话的重要组成部分

话音压缩编码技术,IP电话的重要组成部分

【摘要】:话音压缩编码技术是IP电话技术的一个重要组成部分。G.723.1采用5.3/6.3Kbit/s双速率话音编码,其话音质量好,但是处理时延较大,它是目前已标准化的最低速率的话音编码算法。目前基本上所有的设备均支持G.711、G.723、G729几种编码,在VoIP系统中,我们一般建议局域网内使用G.711编码;Internet环境使用压缩编码G.723或G.729;表5-2说明实际带宽与语音编码和打包时长的关系。

话音压缩编码技术是IP电话技术的一个重要组成部分。目前,主要的编码技术有ITUT定义的G.729、G.723(G.723.1)、G.711等。

G.729可将经过采样的64Kbit/s话音以几乎不失真的质量压缩至8Kbit/s。由于在分组交换网络中,业务质量不能得到很好保证,因而需要话音的编码具有一定的灵活性,即编码速率、编码尺度的可变可适应性。G.729原来是8Kbit/s的话音编码标准,现在的工作范围扩展至6.4~11.8Kbit/s,话音质量也在此范围内有一定的变化,但即使是6.4Kbit/s,话音质量也还不错,因而很适合在VoIP系统中使用。G.723.1采用5.3/6.3Kbit/s双速率话音编码,其话音质量好,但是处理时延较大,它是目前已标准化的最低速率的话音编码算法

此外,静音检测技术和回声消除技术也是VoIP中十分关键的技术。静音检测技术可有效剔除静默信号,从而使话音信号的占用带宽进一步降低3.5Kbit/s左右;回声消除技术主要利用数字滤波器技术来消除对通话质量影响很大回声干扰,保证通话质量。这点在时延相对较大的IP分组网络中尤为重要。

IP电话与传统电话最大的不同在于其语音模拟信息以分组数据的形式在数据网中传输,因此,在语音终端和数据传输网络之间需要一个信源编码器(通常叫网关),将连续的语音模拟信号分割成一定长度的多个语音数据分组,并对其进行压缩处理,减小信源语音消息的多余度,降低传输码率,提高传输消息的有效性。又因为IP采用基于TCP/IP协议的包交换技术,所以在通过传输信道传送前,其会将压缩后得到的数据封装到IP数据包中实现在IP交换网的传输,由于网络上实际传送的码流并不是编码后输出净菏码流(语音包),如5.3Kbit/s(G.723.1)或8Kbit/s(G.729),而是经过封装后的码流。它的一般封装形式为在语音包前加上IP包头、UDP包头和RTP包头。IP包头为20字节,UDP包头为8字节,RTP包头为12字节,总包头长度为40字节。通过增加这部分多余字节,达到寻址、提高可靠性等功能。

封装的效率取决于一个RTP包中打多少数量的语音包,RTP包头所打的语音包越多,封装效率就越高,单位流量也就越小,电路利用率就越高,但是由于RTP包头所携带的语音包个数增加,单个IP数据包的传输时延在一个话音来回的历时加长,全网时延就加大,给消费者最直接的感觉就是“对方反应迟钝”,反之亦然。因此,在设计系统时,用户需要在提高电路利用率和减少时延中做出选择,两者是难以两全的。

目前基本上所有的设备均支持G.711、G.723、G729几种编码,在VoIP系统中,我们一般建议局域网内使用G.711编码;Internet环境使用压缩编码G.723或G.729;

表5-2说明实际带宽与语音编码和打包时长的关系。

表5-2 实际带宽与语音编码和打包时长关系表(www.chuimin.cn)

由上表可以很明显地看出,打包时间越长,所占用的实际带宽越小,但时延越大。

说明:

1.RTP包头:12bytes UDP包头:8bytes IP包头:20bytes。

2.表中的带宽计算中没有包含物理帧头,需根据具体网络而定。

3.表中的带宽计算中,没有考虑静音检测,静音检测的效率按60%计算。