音频基础知识编程频道|福州电脑网

2023年12月11日发(作者：)

音频基础知识

CODEC

图1基本音频输入输出系统框图

1.模拟音频接口

1.13.5mm接口

1.1.1插座

首先要了解前置音频插座的结构。根据英特尔关于AC97前置音频接口的规范，机箱的前置音频面板采用两种3.5毫米微型插

座：1开关型的，2无开关型的，见下图：

开关型的2/3，4/5端是两个开关，当没有插头插入时，2/3，4/5端是连通的，当插头插入时2/3，4/5端断开。无开关的就没有

3，4两个开关端。

1.1.2二段三段四段

3.5mm插头有几种规格，最常见的是三段式的，四段式的则在消费电子中应用越来越多，另外也有二段式的，通常用于麦克风

二段、三段式插头

如下图所示：二芯插头一般用于麦克，三芯插头一般用于立体声音耳机（有源音箱）。现在二芯插头很少，所以麦克也用三芯插头。耳机和

麦克插头的接线定义如下图：

四段式插头

根据我们市面上出现的不同标准的耳机插头，耳机市场才将不同的耳机接头方式划分为2个类别：N版和i版，N版耳机主要是适

用于NOKIA、MOTO、OPPO、BBK等手机，而我们的i版耳机插头则主要适用于iphone、HTC、魅族和PC、MP3等电子数码

通讯设备。

要了解清楚这个问题之前，我们先要认识我们耳机插头的结构，在市面上销售的耳机插头主要分为：2.5mm和3.5mm，又被分

为单音耳机插头、立体耳机插头、四极耳机插头、五极耳机插头，主要普遍还是3.5mm见的居多，一般的3.5mm 的耳机插头大

多都是三段式的结构，看完下图你就清楚了！

图为普通耳机插头三段式结构

N版耳机和i版耳机同样是3.5mm的标准，她们之所以适用于不用的手机类型，也正是因为她们的接头设计不同，N版和i版又有

一个共同点，就是都采用的是4段式的耳机插针的结构，不同的是N版的耳机插头从左到右依次是左声道、右声道、麦克、地

线，i版耳机从左到右依次是左声道、右声道、地线、麦克。详情请看下图：

NOKIA耳机插头四段式插头结构

Iphone手机四段式耳机插头结构

1.2RCA接口：

RCA接头就是常说的莲花头。每一根 RCA线缆负责传输一个声道的音频信号，所以立体声信号，需要使用一对线缆。对于多

声道系统，就要根据实际的声道数量配以相同数量的线缆。立体声RCA音频接口，一般将右声道用红色标注，左声道则用蓝色

或者白色标注。

RCA转3.5mm接口

1.3XLR接口

卡侬头是一种更高端的音频接口，是专为电容麦等高端话筒服务的。

“卡侬”是由英文CANNON音译来的，CANNON看起来和“佳能”的英文名很像，不过两者确实没什么关系

卡侬头分为很多种类：两芯、三芯、四芯、大三芯等种类，但最常见的还是三芯卡侬头三芯卡侬头分为接地端、热线（又称火

线）、；冷线（又称零线），分别接到话筒上相应的位置。由于接地是悬浮独立的，所以在长距离传输时不易受到外界杂波讯

号的干扰，专业器材多使用平衡接口就是因为它即使长距离传输依然具有高信噪比的优点。另外，平衡传输也可大幅降低共模

失真。如果放大系统内是真正的平衡线路，当然使用平衡接线最能发挥效果，不过只使用单端接头，平衡线路还是会开足马力

在工作，并不会另一半线路就休息了。有相当一部分音箱和音响产品并不是真平衡线路，通常XLR接头的正负半波接端会一起

进

入线路板的同一个点，XLR接头在此只是好看与方便，并没有太突出的作用。

1.4TRS接口：

1/4 TRS平衡接口能提供平衡输入/输出。TRS的含义是Tip（signal）、Ring（signal）、Sleeve（ground）。分别代表了该接

口的3个接触点（其实与6.22mm接口一样）。1/4 TRS平衡接口除了具有和6.22mm接口一样的优点——耐磨损外，还具有平

衡口拥有的高信噪比，抗干扰能力强等特点。对于一个真正的1/4 TRS 平衡接口来说，其成本将是非平衡的2倍多。因此采用

1/4 TRS平衡接口的设备一般是高档设备，只有在2000元以上的专业卡上才可以看到。

1.5Line in/Line out/Mic in/Speaker out

音频接口上一版会标注Line in/Line out/Mic in/Speaker out等名称，使用时不能混淆。

1.5.1Line in与Mic in

Line in是作为线路输入，输入的信号在外部设备中已经进行过放大，因此输入信号幅度相对较大。

Mic in是作为麦克风输入，麦克风给过来的信号通常较小，需要在内部增加麦克风放大。

1.5.2Line out和Headphone out/Speaker out

Line out作为线路输出，一般由DAC直接输出，输出信号相对较小，接到播放设备上还要再进行信号放大。由于后级会接阻抗

很大的放大器，Line out一般输出阻抗较大。

Headphone out/Speaker out作为耳机/扬声器输出，在设备内部已经进行过放大，输出信号相对较大，直接驱动耳机/扬声器上

即可播放。由于后级直接接阻抗很低的耳机或者扬声器，所以输出阻抗很小。

例如将耳机接到Line out上，输出信号本身较小，并且由于阻抗问题，会发现声音非常小。

2.麦克风

2.1类型

2.1.1动圈式麦克风

动圈话筒是由磁场中运动的导体产生电信号的话筒，是由振膜带动线圈振动，从而使在磁场中的线圈感应出电压。

特点：信号放大倍数小，失真小，声音还原性好，指向性好，无需直流工作电压，噪声小，结构牢固，性能稳定，但灵敏度较

低，一般都在5mV以内，所以拾音距离比较近，在使用时有必须近讲的限制。（备注：无线手持话筒虽然也需要装电池，但它

的电池是给发射音频电路供电，并非给动圈音头供电）

2.1.2电容式麦克风

这类话筒的振膜就是电容器的一个电极，当振膜振动，振膜和固定的后极板间的距离跟着变化，就产生了可变电容量，这个可

变电容量和话筒本身所带的前置放大器一起产生了信号电压。电容话筒需要供电才能工作（比如：1.5V、3V、48V幻象供电

等）特点：频率特性好，在音频范围内幅频特性曲线平坦，这一点优于动圈话筒；无方向性；灵敏度高，噪声小，音色柔和；

输出信号电平比较大，失真小，瞬态响应性能好，这是动圈话筒所达不到的优点；工作特性不够稳定，低频段灵敏度随着使用

时间的增加而下降，寿命比较短，工作时需要直流电源造成使用不方便。

电容话筒中有前置放大器，当然就得有一个电源，由于体积关系，这个电源一般是放在话筒之外的。除了供给电容器振膜的极

化电压外，也为前置放大器的电子管或晶体管供给必要的电压。我们称它为幻象电源。

由于有了这个前置放大器，所以电容话筒相对要灵敏一些，在使用时不可少的一些附属设备有：防震架（一般会随话筒赠

送）、防风罩、防喷罩、优质的话筒架。如果要进行超近距离的录音工作，一个防喷罩是不可少的。

电容话筒从“拾音头”上又分为驻极体式和大电容式两种。大电容音头体积较大，频响宽广而有色彩，具备高分解清晰音色，一般用来组装录音、播音等参数要求较高的话筒，但它又有

不耐潮湿的弱点，一般都要在比较干燥的场所使用或保存，保存时要放干燥剂。

驻极体式音头体积较小，音色清晰明亮，频响一般只有30～16000Hz，往往可以消减环境的高频和低频噪声，适用于人声的拾

取，一般用来组装采访、领夹、会议等话筒。

2.2指标

2.2.1灵敏度

灵敏度代表麦克风将声音能量转换成电压后所产生的输出讯号强度，是在麦克风单位声压激励下输出电压与输入声压的比值。

当输入信号固定时(1kHz)，输出讯号越强，代表麦克风灵敏度越高。

测试麦克风的灵敏度是将1kHz的讯号在94dB的音压电平位准( SPL)下量测开路的麦克风，取得的毫伏特( millivolt )值，单位为

mV / Pa。为与电路中电平的度量一致，灵敏度也可以分贝值表示。

早期分贝多以单位dBm和dBV表示：

0dBm=1mW/Pa，即把1Pa输入声压下给600Ω负载带来的1mW功率输出定义为0dB；

0dBV=1V/µbar，把在1µbar（0.1Pa）输入声压下产生的1V电压输出定义为0dB。

现在的分贝则以单位dBµ表示：

0dBµ=0.775V/Pa，即将1Pa输入声压下话筒0.775V（600Ω负载带来的1mW功率）电压输出定义为0dB(这样就把话筒声压-电

压转换后的电平度量，统一到电路中普遍采用的0dB µ= 0.775V这一参考单位)。

显然，不论灵敏度如何表示，我们都可将它转换为dBµ，前提是行输入统一到Pa这个单位。

例如：NEUMANN U89话筒的灵敏度是8mV/Pa，可直接由20lg[(0.008V/Pa)÷(0.775V/Pa)]得出其灵敏度约为-40dBµ。

再如：AKG C414话筒的灵敏度为-60dBV，由0dBV=1V/µbar=10V/Pa先求出1Pa声压下-60dBV的输出电压X：20lg[(X

V/Pa)÷(10V/Pa)]=-60 得出X=0.01(V)，即它的灵敏度为10mV/Pa。再由式20lg[(0.01V/Pa)÷(0.775V/Pa)] 可得其灵敏度约为-

37dBµ。

注：1bar=100kPa

低灵敏度话筒比高灵敏度话筒需要有更大的调音台增益。但过高的增益会导致更大的噪声。在为一种平静的音乐（古典吉他、

弦乐四重奏）在一定距离下拾音时，可使用一支高灵敏度话筒，而不必考虑调音台的噪音。当对大音量乐队或近距离拾音时，

灵敏度就不那么重要了。因为话筒的信号电平要比调音台的噪声级要高出许多。也就是说信号噪声比很高。下面列出了3种类

型话筒的灵敏度指标：电容话筒：5.6mv/Pa(高灵敏度)动圈话筒：1.8mv/Pa(中灵敏度)带式或小型动圈话筒：1.1mv/Pa（低灵敏度）

2.2.2信噪比

信噪比是原始信号和麦克风自身内部噪声强度的比值，以dB为单位。一般可以94dB SPL 减去内部噪声强度( A-weighted)来计

算。信噪比越高，音讯放大越干净。

2.2.3等效噪声电平( Equivalent noise level)

等效噪音电平又称内部噪声( self noise)。麦克风的内部噪声在无声音讯号输入状态时可来自若干个方面：

1.供给麦克风电源的电压波动(偏置电压)引起的电子噪音

2.内部材质电阻(热噪讯)，

3.外部射频发射器的干扰等。(手机）

2.2.4频率响应

频率响应又称带宽(frequency range)，是指麦克风感应声波频率的范围，并将声波能量忠实的转换为电子讯号的能力。麦克风

接受到不同频率声音时，输出信号会随着频率的变化而发生放大或衰减。一般以频率响应曲线图标之。

2.2.5指向性一般分为心形、超心形、8字形、枪式、全向指向等。请看图02

话筒指向示意图

2.2.6输出阻抗

当一个设备的输出接到另一个设备的输入时，前面的输出阻抗和后面的输入阻抗已经串联在一起了。形成一个分所谓的阻抗匹

配，阻抗匹配要做的就是尽量将电压传到下一个设备，高质量的麦克风阻抗都很低，高频衰减低，可使用将近60公尺长的信号

线而不至失真。而且静电杂音较少、适合专业录音。

高阻抗麦克风容易感应日光灯或马达产生的静电杂音，且有明显的高频衰减，不适合专业始用，讯号线长度不宜超过3公尺。

话筒阻抗是指话筒在1kHz时的有效输出电阻。阻抗在150～600Ω的话筒为低阻话筒；1000～4000Ω的话筒为中阻话筒；高于

25kΩ以上的话筒为高阻话筒。

通常要使用的是低阻话筒。这样可以用较长的话筒线而不致拾取交流声或是损失高频部分。调音台的话筒输入口的输入阻抗约

为1500Ω。如果调音台与话筒的阻抗相等，例如都为250Ω，那么当话筒接入调音台后，将会引起“负载下降”。负载的下降将引

起电平的损失、失真或是声音变薄。为了防止这种现象出现，调音台的话筒输入阻抗必须高于话筒的阻抗。不过，这种输入阻

抗仍称之为低阻抗输入。

2.2.7平衡与非平衡

平衡线由两根导线和一根屏蔽线构成；非平衡线中则只有一根导线，用屏蔽线代替第二根导线。

平衡线的优点在于，该线的两根导线拾取不需要的噪声信号的强度相等，因而二者能互相抵消掉。而非平衡线则把噪声信号传

输到线路的下一级。如果音频信号很强或非平衡线很短，可能不会听到噪声。但话筒线一般都很长，想想看，我们是从录音间

拉出线来，经传声盒过墙后再进入控制室的调音、录音系统的。所以，我们要使用平衡线，并相应地使用平衡的插头：XLR/俗

称卡农头或公母头；或者是大三芯的TRS。

2.3供电

2.3.1驻极体麦克风供电

驻极体电容器麦克风内部有两块金属极板，其中一块表面涂有驻极体薄膜并将其接地，另一极板接在场效应晶体管的栅极上，

栅极与源极之间接有一个二极管。当驻极体膜片本身带有电荷，表面电荷地电量为Q，板极间地电容量为C，则在极头上产生

地电压U=Q/C，当受到振动或受到气流地摩擦时，由于振动使两极板间的距离改变，即电容C改变，而电量Q 不变，就会引起

电压的变化，电压变化的大小，反映了外界声压的强弱。驻极体电容器麦克风由于具有一系列优点，称为了使用最广泛的麦克

风类型。

市面上常见的驻极体电容器麦克风都在内部集成了一个场效应管(FET)。驻极体电容的一端接到了FET 的Gate 端，见图1的虚

线框所示。

图1 驻极体电容器麦克风的供电电路

上图中还给出了驻极体电容器麦克风的供电电路，通常供电电压U 选择在3~5V 就可以了，电阻R 在2K到5K之间，电容通常选

择10uF 左右就足够了。这种类型的麦克风通常采用3.5mm 接口，就是我们常见的耳机接口。有些用3.5mm 单声道接口，有些用的是3.5mm 双声道的

接口。其实都一样，真正有用的只有两根线。图2 给出了3.5mm 双声道的接口时的接线方式。

3.5mm 接口的连线示意图

2.3.2幻象供电

幻象供电方式是现今专业麦克风领域最常用的供电方式。幻象供电这种方式是由电报工程师发明的。他们利用平衡传输线作为

一条导体，大地作为另一个导体构成一个信号回路，这种方式可以省掉一根电线。由于供电传输的是共模信号，对平衡传输线

上的差模信号是没有影响的。所以即使噪声进入了电源，也不会影响传输的信号。

IEC 61938的7.4小节给出了幻象供电的标准。幻象通常为48VDC，现在也有采用12VDC 的。曾经有一段时间还有个24V 供电

的版本(P24)，但是现在已经被淘汰出局了。

采用幻象供电的麦克风通常采用XLR 接头，这种接头也被称为卡农头。现在也有些麦克风采用6.35mm （1/4 英寸）耳机接

头。

图1 幻象供电麦克风的接口方式

图1 是一种最常用的供电方式。48V 电源通过两个6.8K 电阻导入平衡传输线。平衡信号通过隔离变压器变为单端信号输出。如

果不使用变压器，可以两个隔直电容将供电隔离，然后用差分放大器将差模信号提取出来。

如果我们现有的前置放大器只有单端信号放大能力，也可以只利用差分信号线中的一根来提取信号，如图2 所示。这种方法抗

干扰能力稍差，但是对于大多数的应用来说也足够了。大量的实践证明，麦克风信号的噪声主要来自于录音环境的背景噪声而

不是电子学电路的噪声。不过许多人可能都没有正视这一结论。图2 平衡信号的非平衡处理方式

如果我们的隔离变压器带有中心抽头，那么幻象供电可以采用如图3所示的方式。这种方式的实际效果也非常好。

图3 使用带中心抽头的隔离变压器时的供电电路

3.扬声器/耳机

3.1扬声器

3.1.1扬声器分类

扬声器的种类很多，按其换能原理可分为电动式（即动圈式）、静电式（即电容式）、电磁式（即舌簧式）、压电式（即晶体

式）等几种，后两种多用于农村有线广播网中，电动式扬声器具有电声性能好、结构牢固、成本低等优点，应用广泛；

按频率范围可分为低频扬声器、中频扬声器、高频扬声器，这些常在音箱中作为组合扬声器使用；

按声辐射材料分纸盆式、号筒式、膜片式；

按纸盆形状分圆形、椭圆形、双纸盆和橡皮折环；

按音圈阻抗分低阻抗和高阻抗。

3.1.2性能指标

扬声器的主要性能指标有：灵敏度、频率响应、额定功率、额定阻抗、指向性以及失

真度等参数。

1.额定功率

扬声器的功率有标称功率和最大功率之分。标称功率称额定功率、不失真功率。它是指扬声器在额定不失真范围内容许的最大

输入功率，在扬声器的商标、技术说明书上标注的功率即为该功率值。最大功率是指扬声器在某一瞬间所能承受的峰值功率。

为保证扬声器工作的可靠性，要求扬声器的最大功率为标称功率的2~3倍。

2.额定阻抗

扬声器的阻抗一般和频率有关。额定阻抗是指音频为400Hz时，从扬声器输入端测得的阻抗。它一般是音圈直流电阻的1.2~1.5

倍。一般动圈式扬声器常见的阻抗有4Ω、8Ω、

16Ω、32Ω等。

3.频率响应

给一只扬声器加上相同电压而不同频率的音频信号时，其产生的声压将会产生变化。一般中音频时产生的声压较大，而低音频

和高音频时产生的声压较小。当声压下降为中音频的某一数值时的高、低音频率范围，叫该扬声器的频率响应特性。

理想的扬声器频率特性应为20~20KHz，这样就能把全部音频均匀地重放出来，然而这是做不到的。每一只扬声器只能较好地

重放音频的某一部分。

4.失真

扬声器不能把原来的声音逼真地重放出来的现象叫失真。失真有两种：频率失真和非

线性失真。频率失真是由于对某些频率的信号放音较强，而对另一些频率的信号放音较弱造成的，失真破坏了原来高低音响度

的比例，改变了原声音色。而非线性失真是由于扬声器振动系统的振动和信号的波动不够完全一致造成的，在输出的声波中增加一新的频率成分。

5.指向特性

用来表征扬声器在空间各方向辐射的声压分布特性，频率越高指向性越狭，纸盆越大指向性越强。

3.2耳机

3.2.1耳机分类

1.动圈耳机：

目前绝大多数的耳机耳塞都属于动圈式耳机，原理类似于小时候拆过的收音机喇叭，处于永磁场中的线圈与振膜相连，线圈在

信号电流驱动下带动振膜发声。

2.动铁耳机：

动铁单元通过衔铁驱动组件中间的衔铁在磁场内运动，通过一个结构精密的连接棒传导到一个微型振膜的中心点，从而产生振

动并发声。

此类耳机多为入耳式，因为可以把动铁单元做的非常小因此可以将两个三个甚至更多单元放入耳道，分别负责不同音域的处

理。音效能与高级喇叭系统相媲美。

想要详细了解动铁耳机原理的可以参考下面这个文档。

动铁耳机.docx

3.静电耳机：

静电耳机的原理是振膜处于变化的电场中，振膜极薄，可以精确到微米级，线圈在电场力的驱动下带动振膜发声。静电耳机的

结构相对于动圈耳机有着天然的优势，静电耳机可以控制振膜的最小点要比动圈耳机小很多，用显示器的分辨率作个比喻就

是，在同尺寸的显示器上，静电耳机的分辨率达到1024乘768，而动圈耳机只能达到800乘600，更小的点组成的声音更为细腻

精准。

3.2.2耳机参数

1.阻抗（Ω）

耳机阻抗其实是耳机交流阻抗的简称，它的大小是线圈直流电阻与线圈感抗之和。驱动阻抗越高的耳机，需要设备的输出功率

就越大。阻抗越大，音源输出影响越小，耳机能够得到的电压越就接近音源。越接近，真实程度就越高。同时阻抗越大，会导

致得到的功率越小。也就是说能量就越少，即“声音越小”。

2.灵敏度（dB/mW）

平时所说的耳机的灵敏度实际上是耳机的灵敏度级，它是施加于耳机上1mW的电功率时，耳机所产生的声压级。也就是说，耳

机的灵敏度越高所需要的输入功率越小，在同样功率的音源下输出的声音越大。

3.失真率

耳机的失真率一般情况下来说很小，在承受最大功率时，其总谐波失真（THD）小于等于1%，基本是不可闻的。

失真是指音响系统对音源信号进行重放后，使原音源信号的某些部分（波形、频率等等）发生了变化。音响调到大音量带来的

失真会使高音刺耳、中音不清、低音浑浊，失真属于噪音的一种。

4.频率响应范围（Hz）

灵敏度在不同的频率有不同的数值，这就是频率响应。频率响应范围是指在振幅允许的范围内音响系统能够重放的频率范围，

以及在此范围内信号的变化量称为频率响应。人耳的听觉范围是20——20000Hz，超出这个范围，绝大多数的人是听不到的。

5.声音的频率范围

极低频，从20Hz—40Hz这个八度被我们称为极低频。低频，40Hz—80Hz这段频率被称为低频。中低频，80Hz—160Hz之

间，我们称之为中低频。中频，160Hz—1280Hz横跨三个八度（320Hz、640Hz、1280Hz）之间的频率我们称之为中频。中

高频，从1280Hz—2560Hz 这段频率被称作中高频。高频，从2560Hz—5120Hz这段频率被称为高频。极高频，从5120Hz —

20000Hz这段极宽的频段，被称作极高频。低于20Hz的所有频段被我们称作次声波，高于20000Hz的被称作超声波。某些频

段的次声波会对人体产生危害，甚至致命。而超声波已被利用到了各个领域。6.单元直径（Φmm）

单元直径指耳机震动单元的直径。

7.插头类型

插头类型指耳机所采用的音频接头样式，耳机上常见的音频插头有3.5mm插头，6.35mm 插头。其中3.5mm音频插头最为常

见，单声道为两段式，立体声为三段式，有麦克风为四段式。6.35mm插头常见于监听或高端HIFI耳机中，某些消费类耳机配

备了3.5mm转6.35mm 接头以方便接驳各种设备，6.35mm插头为三段式，麦克风配备两段式接头。此外还有2.5mm 音频插

头，这种接头常见于手机上，大多数为四段式。航空专用插头，由两个3.5mm单声道插头组成，某些耳机配备这种转换插头，

可将3.5mm或6.35mm的耳机转为航空耳机，供用户在飞机上使用。卡龙头，共有三根针，在一般耳机中极为少见，常见于静

电耳机中。不过开放式动圈耳机神器AKG K1000 用的也是此插头，此外，卡龙头还常用于各种专业音频设备。

8.导线类型

较好的音频线的材质主要有镀金，镀银，无氧铜，高端导线还有纯金，纯银材质，以及某些新材料。音频线的材质对失真率及

频率响应有一定影响，但影响不大，在5%以内。按外形划分有长短线及Y型导线，因长短线左右声道长度不一致，会对两个声

道的均衡性构成一定影响，所以大多数耳机采用Y型导线，监听类耳机为方便使用，多设计为单边导线（即导线只从耳机一侧

通过，并多有电话线式盘旋线设计，以方便使用）。

4.功率放大器

如何正确选择扬声

器设计中的放大器.pd

音频基础知识

发布评论取消回复

最近发表

相关推荐

标签列表

音频基础知识

发布评论 取消回复

最近发表

相关推荐

标签列表

发布评论取消回复