2024年1月24日发(作者:)

数字音频

数字音频:是一种利用数字化手段对声音进行录制、存放、编辑、压缩或播放的技术,它是随着数字信号处理技术、计算机技术、多媒体技术的发展而形成的一种全新的声音处理手段。

数字音频就是首先将音频文件转化,接着再将这些电平信号转化成二进制数据保存,播放的时候就把这些数据转换为模拟的电平信号再送到喇叭播出,数字声音和一般磁带、广播、电视中的声音就存储播放方式而言有着本质区别。相比而言,它具有存储方便、存储成本低廉、存储和传输的过程中没有声音的失真、编辑和处理非常方便等特点。

▌数字音频基础知识

1、模拟信号

音频信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上的也是连续的。我们把这种在时间(或空间)幅度上都是连续的信号称为模拟信号。

2、数字信号

在某些特定的时刻对这种模拟信号进行测量叫采样,在有限个特定时刻采样得到的信号叫离散信号。把幅度取值限定为有限个的信号叫离散幅度信号。我们把时间和幅度都用离散的数字表示的信号称为数字信号。

从模拟信号到数字信号的转换叫模数转换,记为A/D。

从数字信号到模拟信号的转换叫数模转换,记为D/A。

3、采样

采样是是指时间轴上的连续信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点表示出来,使其成时间上离散的脉冲序列。

每秒种采样的次数称为采样频率,简单地说就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。44KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形,原则上采样率越高,声音的质量越好。

4、量化

量化是将采样后离散信号的幅度用二进制数表示出来的过程。

每个采样点所能表示的二进制位数称为量化精度,或量化位数。简单地说就是描述声音波形的数据是多少位的二进制数据,通常用bit做单位,如16bit、24bit。16bit量化级记录声音的数据是用16位的二进制数,因此,量化级也是数字声音质量的重要指标。我们形容数字声音的质量,通常就描述为24bit(量化级)、48KHz(采样率),比如标准CD音乐的质量就是16bit、44.1KHz采样。

5、编码

采样和量化后的信号还不是数字信号,需要把它转换成数字编码脉冲,这一过程称为编码。

模拟音频经过采样、量化和编码后所形成的二进制序列就是数字音频信号。

6、音频压缩

音频压缩是减小数字音频文件大小的过程。

音频压缩算法分为:无损压缩算法和有损压缩算法。

▌数字音频相关技术

杜比数字(Dolby Digital)

“杜比数字(Dolby Digital)是杜比数字(AC-3)音频编/解码技术在DVD及DTV这类消费类格式的应用,在不断的发展普及过程中,Dolby Digital最终定型为5.1声道模式,这也是目前大多数家庭影院或者PC多媒体桌面影院所支持的标准。杜比数字能够提供了五个全频带声道,其中包括左、中、右屏幕声道,独立的左环绕及右环绕声道以及一个独立的用于增强低音效果的“.1”声道,而中置声道很多时候也被用于强化对白,而环绕声道主要用于营造整体声场的立体感。Dolby Digital首先被应用于电影音效,以5.1格式预先录制合成好的音频资料被储存在胶片齿孔的间隙中;而后Dolby Digital又被应用在DVD影碟中,成为家庭影院系统的组成部分,就目前的市场形式而言,它已经成为应用面最为广泛的环绕音频标准,大部分DVD节目都支持这个最基本的环绕音频格式。

DTS

Dolby Digital是将音效资料储存在胶卷上齿孔的中间,因为空间的限制所以必须采用大量压缩的模式,所以也牺牲了部分的音质。而杜比实验的竞争对手DTS公司,则想办法将音轨单独放置在另外的存储设备中(通常是

CDROM),然后再与影像同步。这样做的好处之一就是方便影院更换不同的语言版本,同时在使用时也更加便捷,音色效果更出色。在DVD影碟问世后,Dolby Digital和DTS先后成为两大主流音频格式,而后者在DVD上能够拥有1536Kbps的资料流量,与Dolby Digital(AC-3)一般384Kbps至448Kbps的流量相比较,优势不言而喻,即使将AC-3拉到极限的640Kbps,DTS还是强过1倍有余,这使得DTS能较Dolby Digital听到更多的声音细节,音响效果更加出色。不过由于DTS需要占用影碟上大量的数据空间,所以一般单张DVD-5制式的影碟较少支持DTS音轨。

THX

THX本来是由美国好莱坞的卢卡斯电影公司在80年代初开发和推广的电影院用音响系统专业标准的名称,因为该标准是在卢卡斯电影公司1972年制作的名片《星球大战》的70mm宽银幕、6声道伴音系统的基础上,由公司技术总监汤姆逊·霍尔曼花费了两年时间分析电影院的音响效果不如录音棚的原因,最后完善了上述音响系统,并且在美国各电影院推广,使之成为美国各影院的音响标准,于是这种电影伴音标准就得到了人们的公认,成为电影界的一种规格。因为该标准及系统技术系由汤姆逊通过实验制定的,故命名为“Tomison Holman's experiment”标准,缩写为“THX”标准,相应的音响系统称为“THX系统”,用这种音响系统,可使电影院的声音效果达到录音棚的水平。THX标准的主要意义在于规定了效果,因此通过该标准的环绕声系统都有突出的音效表现能力。一般来说,通过THX认证的系统有以下几个突出的特点:

1、功率大,功率是回放声音不失真的前提条件,尤其是低音,如果功率不够的话在大动态下必然会失真。而通过THX认证的系统动辄就是几百瓦的输出功率,足以保证在最大音量下也不会失真。

2、频响平直、范围宽。通过THX认证的系统的频响范围都很宽阔,这样可以保证不同的声音都能够得到完好的回放,不漏过任何一个微小的细节。

3、音乐还原效果好,通过THX认证的系统的音质都很好,这样可以保证音乐有足够感人的效果。

综合上面的说明,THX认证的好处是显而易见的,但是其缺点也很明显,就是价格高昂。因为其要求很高,所以制造成本将会直线上升,并且THX的认证费用至少要2万美元,这笔不菲的费用也需要分摊到消费者头上,因此价格昂贵也就成为了THX认证系统的唯一缺陷。

▌常见的数字音频文件格式

CD

CD格式的音质是比较高的音频格式,因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化等级,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你是一个音响发烧友的话,CD是你的首选,它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来播放,一个CD音频文件是一个*.cda文件,这只是一个索引

信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。

WAVE

WAVE(*.WAV)是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数。看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。

MPEG

MPEG是动态图象专家组的英文缩写,这个专家组始建于1988年,专门负责为CD建立视频和音频压缩标准。MPEG音频文件指的是MPEG标准中的声音部分即MPEG音频层。目前互联网上的音乐格式以MP3最为常见,虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比,MPEG含有格式包括:MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4。

MP3

MP3是到2008年止使用用户最多的有损压缩数字音频格式了。它的全称是MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer-3,刚出现时它的编码技术并不完善,它更像一个编码标准框架,留待人们去完善。

早期的MP3编码采用的的是128Kbps固定编码率的方式(CBR),可以用64Kbps或更低的采样频率节省空间,也可以用320Kbps的标准达到极高的音质。

MIDI

MIDI(Musical Instrument Digital Interface)格式被经常玩音乐的人使用,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来,MID文件并不是一段录制好的声音,而是记录声音的信息,然后再告诉声卡如何再现音乐的一组指令,这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次,*.mid格式的最大用处是在电脑作曲领域,*.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成*.mid文件。

WMA

WMA (Windows Media Audio) 格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右,还支持音频流(Stream)技术,适合在网络上在线播放。

RealAudio

RealAudio主要适用于在网络上的在线音乐欣赏。real的文件格式主要有这么几种:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),还有更多。这些格式的特点是可以随网络

带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。

APE

APE是目前流行的数字音乐文件格式之一。与MP3这类有损压缩方式不同,APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,你还可以再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。APE的文件大小大概为CD的一半,随着宽带的普及,APE格式受到了许多音乐爱好者的喜爱,特别是对于希望通过网络传输音频CD的朋友来说,APE可以帮助他们节约大量的资源。当然,目前只能把音乐CD中的曲目和未压缩的WAV文件转换成APE格式,MP3文件还无法转换为APE格式。

FLAC

FLAC与MP3相仿,都是音频压缩编码,但FLAC是无损压缩,也就是说音频以FLAC编码压缩后不会丢失任何信息,将FLAC文件还原为WAV文件后,与压缩前的WAV文件内容相同。这种压缩与ZIP的方式类似,但FLAC的压缩比率大于ZIP和RAR,因为FLAC是专门针对PCM音频的特点设计的压缩方式。FLAC文件的体积同样约等于普通音频CD的一半,并且可以自由地互相转换,所以它也是音乐光盘存储在电脑上的最好选择之一,它会完整保留音频的原始资料,用户可以随时将其转回光盘,音乐质量不会有任何改变,而在播放当中,FLAC文件的每个数据帧都包含了解码所需的全部信息,中间的错误不会影响其它帧的正常播放,这保证了它的实用有效和最小的网络时间延迟。目前在国内市场上,FLAC已经是和APE

齐名的两大最常用无损音频格式之一,并且它的编码技术原理使得它在未来有超过APE的巨大的发展空间。

AAC

AAC实际上是高级音频编码的缩写,苹果ipod、诺基亚手机也支持AAC格式的音频文件。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC 通过结合其他的功能来提高编码效率,AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它同时还支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。