2024年3月31日发(作者:)

浅谈MPEG-4国际标准

作者:honey

浅谈MPEG-4国际标准

一、概述

MPEG(Moving Pictures Experts Group,运动图片专家组)是在ISO(国际标准化组织)和

IEC(国际电工委员会)内运作的一个工作组。自从1988年开始活动以来,MPEG已经编制了

ISO /IEC11172(通常所说的MPEG-1)和ISO/IEC 13818(通常所说的MPEG-2)国际标准,其中

包括用于服务器和网络会话的标准协议DSM-CC(Digital storage media command and control,

数字存储媒体命令与控制)。

这些标准已获得产业和服务供应商的广泛支持,并且引起了一场数字革命,使得更加普

遍的交互式媒体得以迅速发展。目前,MPEG将研究重点转向了交互性更加高级的形式,在未

来的几年里,技术的发展将使这种高级形式成为可能。这就是MPEG-4课题的目标,该课题预

计在1998年底完成,该项目的完成可使用户达到关于音频视频内容交互性的多种形式,以及

以一种整体的方式将人工的和自然的音频和视频信息溶合在一起。

MPEG-4技术包含两个主要部分:视听对象的编码工具集和描述编码工具和编码对象的

句法语言(syntatic language)。从技术的观点看,与传统编码标准最显著的不同是:接收者可以

下载用于表示视听信息的语法描述,并且具有很快被VLSI(超大规模集成)技术所支持的特

征。

MPEG-4是一个正在制定的国际标准,它支持用于通信、访问和数字视听数据处理的新

方法(特别是基于内容的)。考虑到低损耗、高性能技术提供的机会和面临迅速扩展的多媒体

数据库的挑战,MPEG-4将提供灵活的框架和开放的工具集,这些工具将支持一些新型的和常

规的功能。由于快速发展的技术使得工具软件的下载极为便利,因此这种方式极具吸引力。

本文将介绍MPEG-4的特点以及由MPEG-4支持的功能、MPEG-4的结构和一些潜在

的应用,还将介绍制定该标准的工作计划。

二、特点及其功能

的特点

远程通信、计算机和电视/电影工业之间的传统界限极为模糊。历史上原本属于某一领

域的内容现已渗透到其他两个领域中。视频、声音和通信已进入计算机;交互性进入了电视;

视频和交互性则进入了远程通信领域。看起来像一种聚集,实际上并非如此。这三种行业是

从不同的技术角度来研究音像应用的。

在当今世界,应对三种主要趋势予以关注:

● 向无线通信发展的趋势;

● 向交互式计算机应用发展的趋势;

● 视听数据的综合应用不断增长的趋势。

对于传统意义上区分的各行业间的交叉,应综合考虑这三种趋势;目前的标准和正在制

作的标准没有充分涉及这些新的需求。而MPEG-4的重点就是解决这些需求,即综合三种行

业的通用应用,以提供便于交互的音频-视频编码、高压缩比和通用访问能力。为了采用迅速

发展的相关技术的优点,MPEG-4标准将保证高度的灵活性和扩展性。

基于内容的交互性包括人与音像画面中有意义的对象相互作用的能力。目前,这种交互

作用局限于计算机图形,即人工合成的内容。对于新的交互式音像应用,能够提供与自然的、

人工的及自然/人工混合的音像对象的相互作用极为重要。

为了有效使用存储空间和传送带宽,需要有较高的压缩比。对于低比特率的应用,改善压

缩效率非常重要。

通用访问能力是指对有用的音像数据的访问可以在存储和传送媒体的很大范围内进行

的鉴于移动通信的迅速崛起,通过无线网络进行这种应用的访问尤为重要。

高度的灵活性和可扩展性由句法描述语言来保证,这种句法描述语言称为‘MPEG-4句

法描述语言’(MSDL)。MSDL将在下面介绍。

目前的视听标准是为从照像机和麦克风获取的自然内容的编码重现而设计的。由于上

述三个领域的相互渗透,人工内容的应用在不断增长。因此,很显然的需求是一种既适合于自

然对象又适合于人工对象的模式,它能够用来产生单一的音像序列。

2.功能

a.新的或改进的功能

下述8个关键的功能是MPEG-4新的特点,可以认为现存的或其他正在制定的标准不能

完全支持MPEG-4,这些功能由编码工具和MSDL的组合来支持。当特定应用需要时,灵活的

MSDL允许使用不同的编码工具来提供这些功能的不同组合。

这些功能如表1所述,在表1中根据它们是否涉及基于内容的交互性、压缩比或通用访

问能力进行了分组。

b.其他标准的功能

除上述新的或改进的功能外,还有几种其他的重要功能,需要用它来支持已预见到的音

频应用。与新的或改进的功能所不同的是,下面所列的功能已由现行的或其他正在制定的标

准提供。

● 同步———对所表示的音频、视频和其他内容数据进行同步的能力;

● 辅助数据能力———为二进制数据比特流分配通道的能力;

● 虚拟通道分配的灵活性———动态地重新分配视频、音频或数据通道的能力;

● 低延迟模式(端对端或解码器)———对系统、音频和视频编码进行低延迟操作的

能力;

● 用户控制———支持交互操作中用户控制的能力;

● 传送媒体交互运作———在各种媒体上进行运作的能力;

● 与其他音像系统的交互运作———与各种类型的终端相互作用的能力;

● ●

多点能力———具有多源或多目的地的能力;

● ●

安全———提供密码、鉴别和密钥管理的能力;

● 内容———对各种类型的可视画面和音频内容进行编码的能力(高的和中等质量

的音频、宽带、窄带、智能和人工语言及人工音频);

● 格式———对各种格式的音频和视频进行编码的能力;

● 质量———对解码的音频或视频质量的评估。

三、MPEG-4的结构

MPEG-4结构将为特定问题提供完整的解决方案,并且具有对最新的音像编码技术进行

灵活复制的能力。从过去MPEG的经验看,预计MPEG-4由4个不同的部分组成:MPEG-4句

法描述语言、工具、算法和轮廓。这些部分如下图所示:

-4句法描述语言(MSDL)

MPEG-4句法描述语言的目的是便于工具、算法和轮廓的选择、描述和下载,以及描述

如何分析和处理基本的数据流。MSDL将提供解决下述有关方面的途径:

● 协商解码器的配置,该结果将决定轮廓;

● 描述轮廓:各组成部分以及这些组成部分间的链接;

● 在非特定机器语言中下载丢失部分,特别是在音像应用中;

● 用与所选择的轮廓相一致的语法和语义来传送数据(音像和其他)。

2.工具

工具是一种通过MPEG-4句法描述语言或使用MSDL描述的语言来访问的技术。它可

通过软件或硬件来实现。

工具示例:运行补偿和形状表示。

3.算法

算法是提供一个或多个功能工具的有机组合。

算法示例:MPEG-1音频,MPEG-1视频和MPEG-2系统。

4.轮廓

轮廓是以特定的方式限定的一个算法或一组算法,用以解决一组特定的应用问题。

轮廓示例:MPEG-2 at Main Profile@ Main Level。

5.哪些内容需要标准化

以特定的方式可以将其下载到MPEG-4终端上的部分不需要标准化。按照MPEG的经

验,下一步很可能就是对MPEG-4句法描述语言、一些工具和一些轮廓的标准化。虽然不必

对所有的应用规定轮廓、算法甚至工具。但在轮廓级别范围内,下列应用是必须进行标准化

的:

● 某些应用需要解码器开启与声音和图像重放之间的延迟尽可能的短;标准化的轮

廓保证最快的开启。

● 某些应用使用了有限的易出错的传送资源,如无线网络。

● 下载花费时间较长,在临界阶段差错风险率较高。

● 尽管软件和硬件技术在发展,但那些费效最好的终端的生产仍然要求专门的编码

硬件和特定软件平台。

通过使用下载,MPEG-4标准将支持使用不在标准中出现的工具、算法和轮廓。

四、应用示例

下面介绍得益于MPEG-4提供的新功能的三类应用示例,使人们对在今后的产品中如

何使用这些功能有所了解。表2列出了基本的(即要实现的)和可选择的(即用于某些特定应用

的)三种应用示例的功能。基本的/现的用‘E’表示可选择的用‘O’表示

1.音像数据库访问

这一类应用包括检索、处理、表示和音频、视频数据的存储。通过各种各样的无线和

有线传输媒体,可以对一个通用数据库进行本地(如:从固态存储器)或远程访问。

示例:

●音像终端,如专用数字辅助设备(PDA),用于支持电子新闻、电子黄页和移动信息的低

容量网络(如:将来的蜂窝PSTN)。

●固态存储器上的视频存储,用于便携机上的播放/录制

●来自交互式视频目录的电视商场。

2.音像通信和处理

这一类应用包括有线或无线通信系统提供常规的人之间的服务。该类应用还包括传送

和检索音像信息的方法。基本内容的功能能进行新型的交互,如:改进用户可选择区域的质量。

示例:

●可视电话

●多点可视会议系统

●可视应答器

●可视e-mail

3.远程监视和控制

这一类应用包括在宽比特率的网络上使用照像机和麦克风。为了有效地传送和存储监

视的音像数据需要高的压缩比。

示例:

●建筑物、工地的安全监控等

●车辆交通监控

五、MPEG-4工作计划

MPEG-4将研制并证实标准中的MSDL、工具、算法和轮廓。MPEG-4标准将提供其

他相关信息,这些内容是全面地解决实际应用问题所需要的。工作计划分为设标阶段(1996.1

结束)和联合研制阶段。

在联合研制阶段,将吸收投标阶段的结果以制定出最佳标准,即研制灵活和可扩充的

MPE G-4句法描述语言、音像编码工具、算法的轮廓的初始集合。

目前,MPEG-4标准的研究已经产生了MSDL的工作组文件(WD),计划1997年7月形成

WD的最后版本,1997年11月形成委员会草案(CD),1998年3月形成国际标准草案(DIS),1998

年11月形成正式国际标准(IS)。我国已将MPEG-1标准转化为我国国家标准(等同采

用),MPEG2也已列入今后两年的国家标准制定计划,我们将密切关注MPEG-4标准的研制动

态,适时地将其转化为我国国家标准。