2024年3月31日发(作者:)

MPEG-4的音频标准

曾制定出MPEG-1和MPEG-2视音频压缩标准的运动图像专家组(MPEG)目前

正在发展最新的MPEG-4标准,其目标是提供未来的交互式多媒体应用。MPEG-4将

制定出与以往不同的、具有高度灵活性和可扩展性的未来新一代国际标准。在音频标准的

制定方面,比较以前的音频编码标准,MPEG-4增加了许多新的关于合成内容及场景描

述等领域的工作,增加了诸如可分级性、音调变化、可编辑性及延迟等新功能。MPEG-4

将以前发展良好但相互分离的高质量音频编码、计算机音乐及合成语音等第一次合成并在

一起,在诸多领域内给予高度的灵活性。

MPEG-4中关于音频信号将包括:传统的音频编码标准,即所谓"自然音频"(natural

audio)和新颖的"结构音频"(structured audio)以及自然和合成混合在一起的"合成/自

然混合编码"(Synthetic/natural hybrid coding)简称SNHC。其中SNHC是MPEG-

4中关于音视频的一个很重要的概念。

1 传统的自然音频编码

一个基本的概念就是MPEG-4的编码工具不再仅限于支持码率的减少,其各种不同

的工具支持从智能语音到高质量多声道音频信号,以及此范围内的音频信号的质量。MPEG

-4编码工具支持的其他功能还有:

.速度的变化,允许不改变音调实现时间尺度变化;

.音调的变化,允许不改变时间尺度实现音调改变;

.码率的可分级性,对比特流的分解可在传输或解码器中进行;

.带宽的可分级性,代表部分频谱的比特流的一段可在传输或解码过程中被抛弃;

.编码器复杂度的可分级性;

.强纠错性等。

MPEG-4标准的自然音频编码将码率范围规定为每声道2kbit/s~64 kbit/s。在如此

宽的范围内定义了三种类型的编码器或叫编码工具。在最低的码率范围2~6 kbit/s之间

使用的是参数编码(parametric coding),最适合于采样率为8kHz的语言信号;在6~

24 kbit/s的码率范围内使用的是编码激励的线型预测编码(code excited linear

predictive coding)简称CELP,支持采样率为8kHz和16 kHz的语言和音频信号;在最

高的16~64 kbit/s的码率范围内使用的是时间/频率编码(time/frequency

coding)技术,比如MPEG-2 AAC标准,支持采样率为8~96 kHz的任意音频

信号。

1.1 参数编码

参数编码提供了两种编码工具:HVXC和HILN。

谐音矢量激励编码HVXC(Harmonic Vector eXcitation Coding)编码工具允许对

语言信号在2kbit/s和4kbit/s之间进行可分级性编码。HVXC的解码过程分四步进行:参

数的反量化;对声音帧用正弦合成产生激励信号和加上噪声分量;对非声音帧通过查找码

书产生激励信号;LPC(线型预测编码)合成。对合成语言质量的增强可以使用频谱后置