;1 概述; 传输码率也称为数码率或编码速率,表示传输每秒钟语音信号所需的比特数。 语音编码的目的: 在保证语音音质和可懂度的条件下,采用尽可能少的比特数来表示语音。 通常所说的“话音编码”,是特指通信传输系统中代表口语发声的300Hz~3400Hz的信号。 本章以前面学习过的语音信号处理技术和方法为基础,介绍语音编码基本原理和常用的编码方法。;2 语音编码的分类及特性; 波形编码是将时间域或变换域信号直接变换为数字信号,力求使重建语音波形保持原始语音信号的波形形状。 要求重建语音信号 的各个样本尽可能地接近原始语音信号s(n)的样本值,因此在波形编码中,信噪比总是一个有用的性能评定标准。

; 波形编码优点: 适应能力强,算法简单,易于实现,语音质量好。 波形编码缺点: 编码速率高,一般在16kbit/s~64kbit/s之间。 传统的波形编码方法分类: 脉冲编码调制(PCM) 自适应增量调制(ADM) 自适应差分脉冲编码调制(ADPCM) ;脉冲编码调制PCM编码速率:64kbit/s自适应增量调制ADM编码速率:32kbit/s-16kbit/s 自适应差分脉冲编码调制ADPCM编码速率:32kbit/s ;2.2 参数编码 参数编码又称声码器编码,是将信源信号在频域或其它变换域提取特征参数,然后对这些特征参数进行编码和传输,在译码端再将接收到的数字信号译成特征参数,根据这些特征参数重建语音信号。 这种编码方法重建语音信号与原始语音信号样本之间没有一一对应关系。 合成语音的音质好坏需要借助于主观评定,缺少客观的评定标准。 ; 参数编码优点: 编码速率低,且这类编码器对讲话环境噪声较敏感,需要安静环境才能给出较高的可懂度。 参数编码器有: 共振峰声码器 线性预测声码器 余弦声码器。;2.3 混合编码 二十世纪80年代产生混合编码。 优点:保留参数编码技术精华,并引用波形编码准则去优化激励源信号,克服了原有波形和参数编码的弱点,而吸取了它们各自的长处。 缺点:算法复杂、运算量很大。 编码速率:4kbit/s~16kbit/s 包括:多脉冲激励线性预测编码(MPELP) 码本激励线性预测编码(CELP);2.4 语音压缩编码的依据 ; 语音信号幅度统计特性: 具有动态的、时变的、多维的暂态概率密度分布的随机过程。统计时间长度不同,它表现的概率密度分布形式不同。 一般长时(几十秒以上)统计幅度特性接近于gamma分布,短时(几到几十毫秒)统计幅度特性接近于高斯分布。 但无论哪种统计特性,语音信号总是小幅度出现概率大,大幅度出现概率小。; 语音信号具有冗余度的另一原因:语音样点之间存在相关性。 利用语音信号的相关性,在时域上采用短时和长时预测,在频域上采用谱平整方法,可以达到压缩编码比特率的目的。; 语音压缩编码的第二个途径是利用人耳的听觉特性。 人类听觉有一个特点: “听觉掩蔽效应”,是指一个强音能抑制一个同时存在的弱音的听觉。 听觉掩蔽效应在语音压缩编码中有非常重要的作用。; 3 语音编码性能的评价指标 评价一个语音编码算法性能的基本指标包括: 编码速率、语音质量评价、编解码延时以及算法复杂度。 这四个因素之间有着密切的联系,在具体评价一种语音编码算法的优劣时,需要根据具体的实际情况,综合考虑四个因素进行性能评价。 ;3.1 编码速率 ; 降低编码速率是语音编码的首要目标,根据编码速率和输入语音的关系可将编码器分成两类:固定速率编码器和可变速率编码器。 现在大部分编码标准都是固定速率编码,其范围为0.8kbit/s~64kbit/s。其中: