2024年6月6日发(作者:)
2010年第1期
总第97期
佳木斯教育学院学报
JournalofJiamusiEducationInstitute
No.1.2010
Sum97
MPEG-1
声音压缩与
MP3
侯清江
(郑州职业技术学院电气电子工程系河南郑州450121)
摘 要:本文阐述了MPEG标准,重点介绍MPEG-1声音压缩标准,MPEG-1声音压缩与MP3播放器的关系,以及MP3播放器的形成
和特点。
关键词:MPEG;MPEG-1;MP3
中图分类号:N37文献标识码:A文章编号:1000-9795(2010)01-0090-02
一、MPEG概述
MPEG的全名为(MovingPicturesExpertsGroup,MPEG),
中文译名是动态图像专家组。是在1988年由国际标准化组织
(InternationalOrganizationforStandardization,ISO)和国际电工委
员会(InternationalElectrotechnicalCommission,IEC)联合成立的
专家组,负责开发电视图像数据和声音数据的编码、解码和它们的
同步等标准。这个专家组开发的的标准成为MPEG标准,到目前为
止,已经开发和正在开发的MPEG标准有:
-1:数字电视标准,1992年正式发布。是针对1.5Mbps
以下数据传输率的数字存储媒体运动图像及其伴音编码设计的国际
标准,主要用于在CD-ROM(包括Video-CD、CD-I等)存储彩
色的同步运动视频图像,它针对SIF(标准交换格式)标准分辨率
(NTSC制为352×240;PAL制为352×288)的图像进行压缩,每秒可
播放30帧画面,具备CD(指激光唱盘)音质。同时,它还被用于数字
电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播
(VOD)、教育网络等。
使用MPEG-1的压缩算法,可以将一部120分钟长的电影压缩
到1.2GB左右,因此,它被广泛地应用于VCD制作和一些视频片段
的下载,目前90%以上的VCD都是用MPEG-1格式压缩的。
-2:数字电视标准,1994年正式发布。是针对
3~10Mbps的数据传输率制定的的运动图像及其伴音编码的国际标
准。MPEG-2可以提供一个较广的范围改变压缩比,以适应不同画
面质量、存储容量和带宽的要求。它在与MPEG-1兼容的基础上实
现了低码率和多声道扩展:MPEG-2可以将一部120分钟长的电影
压缩到4~8GB(它提供的是我们通常所说的DVD品质),其音频编码
可提供左右中及两个环绕声道、一个加重低音声道和多达7个伴音
声道(因此DVD可有8种语言配音)。
除了作为DVD的指定标准外,MPEG-2还可用于为广播、有
线电视网、电缆网络等提供广播级的数字视频。不过对普通用户来
说,由于现在电视机分辨率的限制,MPEG-2所带来的高清晰度画
面质量(如DVD画面)在电视上效果并不明显,倒是其音频特性(如加
重低音、多伴音声道等)得到了广泛的应用。
-3:已于1992年7月合并到高清晰度电视(HDTV)工
作组,但由于MPEG-2的出色性能已能适用于HDTV,因此MPEG-3
标准并未制定。
-4:多媒体应用标准,1998年11月被ISO/IEC批准为正
式标准。是针对一定比特率下的视频、音频编码,更加注重多媒体
系统的交互性和灵活性。
-5:直今还没有看到定义。
-6:直今还没有看到定义。
-7:多媒体内容描述接口标准。继MPEG-4之后,要
解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索。
1998年10月基于这种设想的MPEG-7标准被提出,它的正式名称是
“多媒体内容描述接口”,将对各种不同类型的多媒体信息进行标
准化的描述,并将该描述与所描述的内容相联系,以实现快速有效
的搜索。
-21:MPEG在1999年10月的MPEG会议上提出了“多媒
体框架”的概念,同年的12月的MPEG会议确定了MPEG-21的正式
名称是“多媒体框架”或“数字视听框架”,它以将标准集成起来
支持协调的技术以管理多媒体商务为目标,目的就是理解如何将不
同的技术和标准结合在一起需要什么新的标准以及完成不同标准的
结合工作。
二、MPEG-1声音(MPEG-1Audio)
MPEG-1声音标准方案由5个部分组成:-1系统
(MPEG-1Systems),规定电视图像数据、声音数据及其他相关
数据的同步。-1电视图像(MPEG-1Video),规定电视数
据的编码和解码。-1声音(MPEG-1Audio),规定声音
数据的编码和解码。-1一致性测试(MPEG-1Conformance
testing),这个标准详细说明如何测试位数据流和解码器是否
满足MPEG-1前3个部分(Part1,2和3)中所规定的要求。这些测
试可由厂商和用户实施。-1软件模拟(MPEG-1Software
simulation),实际上,这部分的内容不是一个标准,而是一个技术
报告,给出了用软件执行MPEG-1标准前3个部分的结果。
MPEG-1声音压缩采用子带编码方法(sub-bandcoding,
SBC),这种方法首先把时域中的声音数据变换到频域,对频域中
的子带分量分别进行量化和编码;然后根据心理声学模型确定样本
的精度,从而到达压缩数据量的目的。
MPEG-1声音(MPEG-1Audio)标准的主要性能指标如下:
(1)MPEG-1编码器的输入信号为线性PCM信号,采样率为
32kHz、44.1kHz或48kHz,输出为32kb/s~384kb/s。
(2)MPEG-1声音标准提供三个独立的压缩层次:层1(Layer
1)、层2(Layer2)、层3(Layer3),用户对层次的选择可在复
杂性和声音质量之间进行权衡。
①层1(Layer1)的编码器最为简单,编码器的输出数据率为
384kb/s,采用的算法主要是将数字音频输入分解成32个子带滤波
器、将数据按一定的格式分块的固定分割、确定自适应比特分配的
心理学模拟、以及使用块压扩和格式化的量化。主要用于小型数字
盒式磁带(DCC),压缩率为4:1。
②层2(Layer2)的编码器的复杂程度属于中等,编码器的输
出数据率为256kb/s~192kb/s,它提供对比特分配、标度因子和取
样附加码,使用了差帧。其应用包括数字广播声音(DBA)、数字
收稿日期:2009-12-03
作者简介:侯清江(1968-),男,河南新安人,从事电子技术、自动化方向的研究。
90
2010年第1期
总第97期
佳木斯教育学院学报
JournalofJiamusiEducationInstitute
No.1.2010
Sum97
音乐、只读光盘交互系统(CD-I)和视盘(VCD)等,压缩率为
6:1~8:1。
③层3(Layer3)的编码器最复杂,编码器的输出数据率为64
kb/s,它基于一个混合滤波器组将频率分辨率提高,增加了非均匀
量化器、自适应分割以及对于量化值的熵编码。广泛应用于ISDN网
络和电视应用、数字卫星广播,压缩率为10:1~12:1。
(3)压缩后的比特流具有预定的几种比特率之一。此外,
MPEG-1音频标准也支持用户使用预定的比特率之外的比特率。
(4)编码后的比特流支持循环冗余校验CRC(Cyclic
RedundancyCheck)。
(5)MPEG-1音频标准还支持在比特流中载带附加信息。
MPEG-1声音压缩标准包括了三个使用高性能音频数据压缩方
法的感知编码方案(perceptualcodingschemes)。按照压缩质量(每Bit
的声音效果)和编码方案的复杂程度分别是Layer1、Layer2、Layer3
三个层次。所有三个层次的编码采用的基本结构是相同的。它们均
采用传统的频谱分析和编码技术的基础上应用了子带分析和心理噪
声感知模型理论。也就是通过研究人耳和大脑视觉神经对音频失真
的敏感度,在编码时先分析声音文件的波形,利用过滤器找出噪声
电平(NoiseLevel),然后滤去人耳不敏感的信号,通过矩阵量化的方
式将余下的数据每一位打散排列,最后编码形成MPEG-1声音压缩
文件。虽然压缩是有失真的,但对人耳来说这些失真是听不到的,
也即对人耳而言,MPEG-1音频压缩是不失真的。因此,MPEG-
1音频标准的应用非常广泛。
将音频文件压缩成MP3文件,其实就是利用MP3编码器找到并
删除音频文件中人耳听不到的声音。正常的人耳只能听到频率在20
赫兹至2万赫兹的声音,音频文件中包含的一些声音可能超出了人
耳所能听到的范围,另外还有一些细微的声音可能被更大的声音掩
盖,还有一些音乐中的声音可能根本就是多余的。编码软件能将代
表这类声音的文件找出来并加以删除。这样,原先臃肿的音频文件
就变小了。压缩音乐文件时,人们通常会说以多大的压缩比率进行
压缩,压缩比率的单位为Kbps(千字节/秒)。当选择较高的压缩比率
时(如128Kbps),原始文件中被去除的数据将会比较少,音质比较
好,但压缩后的文件比较大,有时会导致文件无法使用;相反,当
选择的压缩比率较低时(如64Kbps),被去除的数据会比较多,这样
做虽然缩小了文件,但却会造成音质损失。
3的特点
音乐品质好,由于MP3是采用1:10的数字压缩格式,在64kbs
压缩率下,标准的MP3过滤掉了10kHz以上的声音来节省空间,以减
小文件尺寸,但是音乐的细节部分特别是高频会受到损耗,所以,
在听感上仍无法和采用传统模拟技术的磁带以及采用无损编码方式
的CD唱片相媲美。
MP3格式压缩比高,可以使音乐文件在音乐质量做很小牺牲的
情况下将文件大小缩小很多。因此,目前网络上的音乐格式以MP3
最为常见。
MP3通用性开放性好,有移动随身听MP3播放设备,各种软件
工具较多。因此,所有的语音、音乐等音频资料文件全部采用MP3
压缩格式保存,参数:采样频率44.1kHz,采样精度16位,压缩比率
128kbps,立体声。这种高质量的参数便于以后编辑处理,而其它
各种数字音频则根据不同要求用相关软件再进行处理,但是原始文
件质量一定要留有备份且品质要高,因为各种压缩格式都是有损压
缩,无法复原。
三、MP3播放器
3概念及MP3播放器的出现
MP3的全称是MovingPicturesExpertsGroup,AudioLayerIII,它
就是MPEG-1层3(Layer3),所使用的技术就是MPEG-1层3(Layer
3)音频压缩技术。是对声音信号进行压缩的一种格式。市场上的
所说的MP3,实指MP3播放器。
MP3格式研究于1987年在德国Erlangen的Fraunhofer研究所开始
的,1989年Fraunhofer在德国被获准取得了MP3的专利权,几年后这
项技术被提交到国际标准组织(ISO),整合进入了MPEG-1标准。
最早的播放器是Frauenhofer在1990年早期开发的,但只是一个
非常不知名的小程序,没有引起大家的重视。而被大家公认的第
一个MP3播放器是在1997年,由一个叫做TomislavUzelac的开发者
开发的。他开发了AMPMP3播放引擎。当AMP引擎进入网络以后
不久,两个大学生JustinFrankel和DmitryBoldyrev拿到了Amp引擎,
并且为它添加了一个Windows界面,最后他们把这个程序命名为
“Winamp.”1998年,当Winamp作为免费的音乐播放器在网络上传
播的时候,MP3的狂潮开始了。
3音乐的制作
参考文献:
[1]林福宗.多媒体技术基础[M].北京,清华大学出版社,
2000.8.
[2]赵英良.多媒体应用技术实用教程[M].北京,清华大学出版
社,2007.8.
[3]冯博琴等.多媒体技术及应用[M].北京,清华大学出版社,
2005.2.
[4]鄂大伟.多媒体技术基础与应用[M].北京,高等教育出版
社,2003.9.
[5]钟玉琢,蔡莲红,史元春,沈洪.多媒体计算机技术基础及
应用(第二版)[M].北京,高等教育出版社,2005.1.
[责任编辑:李微]
(上接第92页)
(四)加强会计学专业校内实验室及校外实习基地的建设
民办普通高校会计学本科专业至少应具备四个校内实验室:手
工做账实验室、沙盘模拟实验室、电算化实验室、股票交易模拟实
验室。同时,学校还应加强与企业的联系,建立固定的学生实习基
地,定期组织学生参观、了解、调研企业生产经营、会计工作流程
等问题,要求学生分析企业会计现状,并就其主要问题,提出自己
的观点与看法,或就企业财务问题编写出财务案例。
参考文献:
[1]余兴无.中外会计本科人才培养模式的比较研究[J].生产力研
究,2008(4).
[2]陈.美英会计本科教育及其对我国的启示[J].高等教育研
究.2008,(12).
[3]梁爽.澳大利亚会计学位教育的启示与借鉴[N].东北财经大学
学报,2006-3.[责任编辑:郑文昌]
91


发布评论