2024年4月29日发(作者:)

WAV格式中常见的压缩编码(compression code)

WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Inter

change File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows

平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩运

算法,支持多种音频数字,取样频率和声道。标准格式化的WAV文件采样频率为44100

Hz,采样比特为16bit,因此标准的(这里说标准,只是一种广泛采用的波形音频方案)

WAV文件和CD音频格式一样,也是44.1KHz的取样频率,16位量化数字,在声音文件

质量和CD音频相差无几。

下面由useiee详细介绍一下WAV格式文件常见的10种压缩码形式(Compression

Code)。[1]

1. PCM/uncompressed

Pulse Code Modulation,脉码调制信号。是模拟音频信号经模数转换(A/D变换)

直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。Windows的Conver

t工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。

PCM脉码调制数字音频格式是70年代末发展起来的,80年代初由飞利浦和索尼公司

共同推出。PCM的音频格式也被DVD-A所采用,它支持立体声和5.1环绕声,1999年

由DVD讨论会发布和推出的。

PCM的采样精度从14bit发展到16bit、18bit、20bit直到24bit;采样频率从44.1

kHz发展到192kHz。到目前为止PCM这种单纯依赖提高采样规格的技术,其可改进的地

方已经越来越来小。只是简单的增加PCM比特率和采样率,不能从底层改善它的根本问

题。

2. Microsoft ADPCM

Adaptive Differential Pulse Code Modulation,自适应差分脉码调制信号。是一

种数据压缩算法,该算法利用了语音信号样点间的相关性,并针对语音信号的非平稳特点,

使用了自适应预测和自适应量化。即对不同水平的差分序列,用一个相应参数delta作为

平稳化参数去除差分序列的幅值,使得差分编码自动的适应数据间大幅度的跳跃。

Microsoft ADPCM是微软标准的WAV格式文件采用ADPCM编码的文件,区分于

IMA ADPCM文件。MS-ADPCM编码是分块的,每块有块头信息和编码数据。对单声道

信号,每块由7个字节组成,byte0是块预测器predictor,byte1-2是初始delta,byte

3-4和byte5-6分别是两个采样。[2]

3. ITU G.711 a-law [3]

G.711标准也是PCM码的一种。是国际电报联盟(International Telegraph Union,

ITU)订定出来的一套语音压缩标准,主要用于电话。它主要用脉冲编码调制对音频采样,

采样率为8kHz。它利用一个 64kbit/s 未压缩通道传输语音讯号。起压缩率为1:2,即把

16位数据压缩成8位。G.711是主流的波形声音编解码器。

G.711 标准下主要有两种压缩算法。一种是?μ-law algorithm (又称μ-law),主要

运用于北美和日本;另一种就是a-law algorithm,主要运用于欧洲和世界其他地区。其

中,a-law是特别设计用来方便计算机处理的。