(2009-04-01 10:38:00)转载标签: 杂谈分类: 技术天地随着互联网的迅速发展,出现了一种基于Internet的电话新业务——VoIP业务。VoIP(Voice overIP,基于IP的语音通信)也称为IP电话,是建立在Internet上的新型数字化传输技术。VoIP的使用,可以极大地降低用户的通信费用,而互联网的蓬勃发展也促进VoIP技术的迅猛发展。VoIP网络电话的成功开发和应用,预示了以IP为基础的新一代信息网络的出现,积极地探索和跟踪这项新技术无疑具有十分重要的意义。1 语音编码的原理为使VoIP网络电话能够可靠地进行语音通信,必须解决好两个问题:一是在保证一定话音质量的前提下尽可能地降低编码比特率,二是在IP网络环境下保证一定的通话质量。前者正是我们要探讨的语音编码技术,同一段语音信号,采用不同的编码方式,其编码后的比特率各不相同。那么如何对语音信号进行压缩编码从而达到降低语音信号的比特率呢?1.1 利用了语音信号的相关性语音信号主要存在两方面的冗余度,即语音信号幅度分布的非均匀性和样本之间的相关性。非均匀性表现为小幅度语音信号出现的概率大而大幅度语音信号出现的概率小,非均匀量化技术正是针对语音信号的这一特点而提出的,例如ADPCM编码算法;样本之间的相关性表现为样本点之间的短时相关性和相邻基音周期之间的长时相关性,利用语音信号的相关性,可以在实现低速率编码时,也能保持较高的语音编码质量,例如线性预测算法就是利用这一原理。
1.2 利用了人耳的听觉特性人耳对语音信号的听觉特性表现在3个方面:一是人耳对语音信号的分辨率有限;二是人耳对语音信号某些失真不是很敏感;三是人耳的掩蔽效应。低速率高品质语音编码算法的实现就是基于人耳的这些听觉特性,既可以保证人耳感觉不到语音质量的下降,又降低了语音编码速率。1.3 静音压缩测试表明,人在正常谈话时,有50%左右是静音,而静音信息只需很少几个参数(4字节/帧)来表示。静音编码主要由两个算法组成:语音检测(VoiceActivity Detection VAD)和柔和噪声再生(Comfort NoiseGenerator CNG)。VAD是用来检测输入的信号是实际语音信号还是背景噪声。如果检测到是语音信号,则对语音信号进行固定速率的编码;如果输入信号被检测为背景噪声,编码器则对其进行低速率编码。CNG的作用是在话音信号的接收端重构背景噪声。在G.723.1编码器中引入静音压缩技术后,实际的平均编码速率要小于5.3kb/s,可以达到3.5 kb/s以下。VoIP网络电话中已被广泛使用的线性预测合成分析编码就是基于此项原理的应用。2 语音编码技术的分类根据语音编码的发展过程,我们把该技术归纳为以下3类:2.1 波形编码(或称为非参数编码)波形编基本上不考虑信号是如何产生的,而直接将输入的模拟信号抽样编码,然后将量化后的样值传送到终端,在终端原始信号被重组到与原信号大致接近的程度。
因此波形编码方式是能够忠实地表现波形的编码方式。由于这类编码器通常将语音信号作为一般的波形信号来处理,所以它具有适应能力强、话音质量好、抗噪抗误码的能力强等特点,它最大的缺点是同其他的编相比,它要使用大量的带宽,当波形编用于低带宽时,话音质量下降得非常快。脉冲编码调制(PCM)、自适应增量调制(ADM或M编码)、自适应差分编码(ADPCM)、自适应预测编码(APC)、自适应子带编码(ASBC)、自适应变换编码(ATC)等都属于波形编码。2.2 参数编码(或称为模型编码或声码化编码)参数编码是根据声音的形成模型,把声音变换成参数的编码方式。其基本方法是通过对语音信号特征参数的提取及编码,力图使重建语音信号具有尽可能的可懂性,即保持原语音的语义。而重建的信号波形同原语音信号的波形可能会有相当大的差别。由于参数编码是保护语声模型,重建清晰可识别的语声,而不注重波形的拟合,所以这类编码技术实现的是合成语声质量下的低速或极低速的编码。参数编码的优点是:编码速率低,编码速率通常小于4.8kb/s,可以低至600 b/s~2.4kb/s;缺点是:合成语音质量差,特别是自然度较低,连熟人之间都不一定能听出讲话人是谁。
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/tongxinshuyu/article-53342-1.html
王建煊代表了台湾一部分聪明人
乃至现在