2024年1月24日发(作者:)

录音中常见问题分析与对策

录音能够记录和还原自然声音,录音技术在有声语料库建设中具有重要作用。国家社科基金重大项目“汉语方言自然口语语料库建设”、国家语言文字工作委员会“中国语言资源有声数据库”等有声语料库建设项目中均采取录音的形式进行数据采录,将录音文件作为语料库的基础组成部分。在录音过程中,由于各种原因,会导致所录制的语料存在缺陷、不符合相关建设规范要求,如音量值不符合要求、背景噪音过高、存在喷麦现象、音色不统一等。笔者结合工作实际,针对录音过程中存在的各种问题进行分析并提出避免措施和解决方法。因项目建设规范中均推荐或指定了录音器材,文章对因录音器材本身的技术指标引起的问题不做探讨。

1 声音及其特性

从物理学角度,声音是由物体振动产生的一种机械波,因振动产生声音的物体叫做声源。自然界中的声音都是由一系列频率、振幅各不相同的振动组合而成的复音,其中最低频率由声源的整体振动产生,称为基音,其它频率由声源的部分振动产生,称为泛音。基音是主要成分,决定了声音的音高,泛音是次要成分,决定了声音的音色,并能使人明确地感到基音的响度。泛音比基音的频率高,但强度都很弱。

响度、音高和音色是声音的三要素,都与声源的振动有关。声源的振幅决定了声音的响度,振动频率决定了音高,相位决定了音色。响度,又称声强或音量,是衡量声音强弱的参数,与声源的振幅成正比,振幅越大,响度越大,还与人耳与声源之间的距离、声音分散的范围有关,距离越远、分散范围越大,听到的声音越轻,响度越小。音高,又叫音调,指人耳对声音调子高低的主观感受,取决于声源振动的频率,频率越高,音调越高,人耳感觉到声音越“细”,频率越低,音调越低,人耳感觉到的声音越“粗”。男性说话时声带的振动频率为90-140Hz,女性说话时声带的频率为270-550Hz,因此,女性的音调比男性的音调高。音色,又叫音品,是人耳听到的声音的特色,由声源的材料、结构、振动方式等因素决定的,主要取决于泛音。声源不同,发出声音的音色也就不同,根据音色的不同,人们能分辨出声音是由不同声源发出的,例如日常生活中人们通常所说的“未见其人先闻其声”。音色也和声音的波形、声压及时间特性有关系,例如倒序播放声音时,声音的响度、音高均未变化,但音色却发生了明显的变化。

2 录音中的常见问题及处理方法

2.1 音量不符合要求

通常所说的音量就是声音的响度,理想的音量范围应该在-18~-6dB之间。音量不符合要求分为两种情况,一是音量偏低,音量最大值低于-18dB;二是音量过高,音量最大值高于-6dB,甚至超过0dB。音量过低时声音信号太弱,会影响录音质量;音量过大容易损失声音的细节,超过0dB时,会产生削波现象甚至导致失真。

2.1.1 产生原因

话筒摆放位置不合适,录制电平过高或过低,发音人身体的移动或发音变化都可能导致录制的音量不符合要求。

1

2.1.2 避免措施

话筒的摆放位置包括距离、高度和角度三个方面,我们需要综合考虑这三方面,并结合发音人的嗓音特点和采录内容,确定最优的话筒摆放位置,以确保录制的声音清晰、活泼。发音人与话筒的距离一般保持在15-30cm,距离太近,会产生“近讲效应”,出现低频提升现象,导致低音部分出现失真,严重的则完全听不清;距离太远,话筒会拾取过多的环境声音,影响声音的清晰度,具体距离应根据发音人的嗓音大小进行确定。话筒的高度一般在发音人的口鼻之间,并根据发音人的嗓音特点进行调整,高度越低,收集到的唇齿音越明显。发音人的嘴唇与话筒中心线之间的角度保持在30°以内,这时话筒的灵敏度最大,频响最好。

录音时要通过耳机进行全过程监听。监听是录音过程中一个很重要的工作,不仅要对录制的内容、发音的准确性、发音人的节奏、音调、语速、停顿等进行监听,更要从技术方面进行监听,包括音量的变化、录制电平、环境声音、衣服磨擦声等。监听过程中,时刻留意录音波形的变化,及时调整因发音人的声音变化,身体移动引起的话筒距离和角度的变化而产生音量过大或过小的现象,保证录音电平在有效的范围内。同时,对相关问题进行记录,以便后期处理或重新录音。

发音人要保持良好的状态,避免与稿本、桌椅等物品接触发出声音,录音过程中身体不要左右摆动或前后移动,保持与话筒的距离和角度相对固定,以免产生“离轴染色”现象,发音时用力要均匀,保持一定音量,不能忽高忽低。

2.1.3 解决方法

录音结束进行审听时,若发现音量值不符合要求,可以通过后期技术处理进行弥补。当音量值低于-18dB,或者高于-6dB但未超过0dB时,可以在audition中进行调整。选中音量低于-18dB的部分,执行菜单命令“效果—振幅和压限—标准化(进程)”,在弹出的“标准化”窗口(如图1所示)中勾选“分贝格式”,在文本框中输入“-6”,点击确定,即可将该部分的音量最大值调整到-6dB。

图1 利用标准化进行音量调整

当音量超过0dB时会出现削波,0dB以上的波形会被削去,成为一个平面,单纯调整音量是无法解决的。出现削波但声音未失真时可以进行修复,在audition中执行菜单命令“效果—修复—破音修复(进程)”,打开“破音修复”对话框中(如图2所示),根据削波的具体情况设定“输入衰减”参数,使波形的峰点刚好完整出现,这样可以保证在修复破音的同时对其他没有发生削波的信号的影响最小[1]。尽管能够对出现削波的声音进行修复,但修复的同时对峰值附近的波形也产生一定程度的影响,破音修复通常只适用于较轻微的削波,若削波现象严重甚至声音出现失真时,只能重新录音。

2

图2 利用破音修复处理削波现象

2.2 噪音不符合要求

从物理学角度,噪音是物体发生无规则振动时产生的、响度和音高变化混乱、听起来不和谐的声音,如各种尖锐的摩擦声、爆炸声、碰撞声等。从生理学角度,凡是妨碍人们学习、工作和休息,让人们听起来感觉不舒服以及对人们要听的声音产生干扰和影响的声音都是噪音,如图书馆里的说话声、楼道内的喧哗声、汽车喇叭声等。判断一个声音是否属于噪音,通常取决于人的主观感受,在有声语料库录音过程中,凡是与采录文本内容无关的声音都属于噪音,如录制场地周边的环境噪音、电器交流声、工作人员的声音、发音人的衣物摩擦声、咳嗽声等。噪音对录音效果有明显的影响,会对有用的声音信号产生掩蔽效应,使人的听觉灵敏度降低。噪音用响度的单位dB来表示,一般噪音不能高于-60 dB。录音过程中背景噪音超出要求主要是指各种噪音的响度高于-60dB。

2.2.1 产生原因

录制场所声学条件差,外部声音会穿透墙体进入室内;室内电器设备发出的声音,如日光灯的交流声、空调的声音,录音电脑的风扇、机械硬盘工作的声音;电源线缆对信号线缆干扰产生的交流声;现场人员产生的声音,如翻页声音、衣物摩擦声、各种提示声等等都属于噪音,这些声音若高于-60dB就会超出录音要求。

2.2.2 避免措施

录音场所的声学环境直接关系到录音的质量。理想的录音场所是经过声学装修的专业录音室,如果没有专业录音室也可以选择安静房间,如宾馆客房、小型会议室等,但须确保周围没有固定的噪音源。录音时关闭所有门窗、拉上窗帘,必要时在室内布置海绵等增加吸音。每次录音前应对环境噪音进行检测,确保符合项目要求。

录音时关闭各种可能发出声响或干扰话筒正常工作的电器和电子设备,如空调、日光灯、手机等,尤其要关闭手机,若条件许可,应确保20米内无手机开机;照明尽量采用白炽灯或LED光源,录音用电脑与话筒距离不小于1.5米,尽量选用散热风扇声音小、配备固态硬盘的笔记本电脑。

注意设备之间连接线的排放顺序,话筒本身输出的信号较弱,容易受到其他电信号的干扰而产生噪音,连线时要避免电源线和话筒线平行排列,防止产生交流干扰声。录音时笔记本电脑尽可能采用电池供电,则所有设备均为直流供电,可以有效地避免交流干扰声。

发音人在发音时不要移动身体或做其他动作,翻页或做其他动作时停止发音,工作人员通过约定的手势与发音人进行交流,发音人感觉劳累或不适时要停止录音。

2.2.3 解决方法

3

对录音过程中出现的环境噪音,可以在录音后通过audition等软件进行降噪处理,使噪音符合要求。具体方法为,在audition中打开录音文件,放大波形后,选择只有噪音没有人声的波形,执行菜单命令“效果—修复—降噪器(进程)”。在弹出的“降噪器”窗口中,点击“获取特性”,Audition就会把选择的部分作为噪音进行提取,即对背景噪音进行采样,得到相应的曲线并在对话框左上角显示(如图3所示)。然后点击“波形全选”,根据噪音大小适当调整“降噪级别”,单击“确定”即可对整个录音文件进行降噪处理。

图3 利用降噪器处理环境噪音

降噪处理时会将与噪音相同特性的所有内容一起清除,对音质会产生一定的影响,降噪级别越高对音质的影响越明显。为减少对音质的影响,需要根据噪音大小调整降噪级别,在降噪和保真之间寻找一个平衡点,最大程度的保留声音的本色,做到既清除不符合要求的噪音,又不会使处理过的声音产生明显的损失。降噪不要一次性完成,第一次降噪时,将降噪级别设置的低一些,完成降噪后,可以适当提高降噪级别,再次进行降噪处理,一般经过二三次降噪,就可以消除噪音。降噪次数不可过多,否则音质会明显受影响,甚至失真。

在audition中利用“降噪器”所消除的是环境噪音、交流干扰声等持续存在的噪音。对录制过程中可能偶尔出现的工作人员的声音、发音人的咳嗽声、翻页声或其他的间断性声音,如果没有与发音内容重合时,可以直接删除对应的波形。当删除波形会影响时间间隔时,可以将间断性噪音的音量降低到-60dB以下,或者执行菜单命令“效果—静音(进程)”,将这些声音消除。无论哪种噪音,当与发音内容重合时都无法删除,出现这种情况时,只能重新录音。

2.3 喷麦

录音完成后进行审听时,时常听到录音中存在“咚咚声”、“噗噗声”,这种情况虽然可以视为噪音,但却是录音过程中经常出现的另一种现象——“喷麦”。喷麦是指嘴唇与话筒距离过近,发声时产生的气流使话筒音膜振动幅度过大,致使录制的声音产生噗噗声,影响录音效果。

2.3.1 产生原因

发音人与话筒的距离过近,发音产生的气流直接冲击话筒音膜,会使话筒音膜的振动幅度变大,就容易产生喷麦;发音人音量过大,反射声也会增大,反射声进入话筒就容易产生噗噗声或咚咚声;此外,【P】【T】等爆破音本身也容易产生喷麦。

2.3.2 避免措施

当发音人与话筒距离太近是非常容易扑麦,调整话筒的摆放位置,可以有效地避免喷麦现4

象。调整话筒的距离,使发音人与话筒的距离保持在20-30cm之间。调整话筒的高度,使话筒略高于发音人的嘴巴,由于气流通常向下运动,话筒放在嘴唇的下面时更容易喷麦,如果在上面,即使是同样的距离,但因为气流运动方向的关系,就不容易喷麦。适当增大发音人嘴唇与话筒之间的角度,保持在15°—30°之间,避免发音气流垂直接触话筒音膜。同时能保证录制的声音低频、中频、高频较为均衡。

让发音人适当降低音量,不仅可以减少对话筒音膜的冲击,还可以避免声反射现象的发生,从而可以减弱或者避免喷麦现象。必要时可以在话筒和发音人之间加装防风罩或者防风网,但尽量不要使用海绵材质的防风罩,因为海绵体会吸收声音中高频的成分。

当录制【P】和【T】之类的爆破音时,可以适当增大话筒与发音人嘴唇之间的角度,同时提醒发音人发音时嘴唇的动作幅度不要太大,这样都可以有效地减轻呼出的气流对话筒音膜的冲击,减轻或者避免喷麦。

2.3.3 解决方法

喷麦产生的波形具有明显的扰动(如图4所示)。若喷麦与前后内容关联不紧密或者单独出现时,可以直接将其删除或设为静音。当与前后内容关联紧密时不能删除或设为静音,否则会影响声音或语气的完整性,可以通过调低音量,减轻刺耳程度[2],也可以通过执行菜单命令“效果—滤波和均衡—图示均衡器”调整不同频段的增益,降低或者消除喷麦中的低频部分。这些处理方法虽然降低或者去除了喷麦因引起的噗噗声,但对声音本身也造成了一定程度的损害,当喷麦太多、太严重时会对音质产生影响。因此,少量的、轻微喷麦可以通过后期技术处理进行修复,当喷麦严重时只能重新录音。

图4 喷麦产生的波形扰动现象

2.4 音色不一致

音色是由泛音决定的,同时也与发音人的状态、录音话筒和录音的场所有关,后期进行技术处理时也可能会影响音色。

2.4.1 产生原因

发音人状态的变化,在不同的场所录音或使用不同的录音器材,都会使录制的声音音色不一致;后期的技术处理过度也会影响音色。

2.4.2 避免措施

5

人的声音是由口腔音、胸腔音和鼻腔音组成的,口腔音是最主要的,胸腔是人发声时的共鸣体,与鼻腔一起主要产生一些低频声音,这些声音对音色具有重要的影响。发音人的状态会影响音色。当人的状态发生变化,如从室外走进较温暖的室内时,身体会有一个适应时间,若不休息直接录音,发声时鼻腔音和胸腔音就会增多,听起来声音就会发生改变。由于语料库建设需要录制的内容很多,不可能一次性完成,所以一定要确保发音人各方面状况良好再进行录音,相同内容或连续性内容尽可能一次录制完成。

不同话筒的频率响应范围等参数存在差异,录制的声音音色也不同,不同的场所对声音的反射和吸收也不相同,因此,尽量采用一个话筒,调整好音量大小后尽量不再改变,以免引起音质的改变[3],录音声卡等器材也应相同,并尽可能在相同的场所完成录音。

录音完成后,进行降噪、均衡、混响等技术处理时,若处理不当也会对声音的音质、音色产生影响。进行技术处理时务必注意监听,每次处理幅度小一些,避免对音质、音色产生明显影响。

2.4.3 解决方法

后期技术处理虽然可以对声音进行润色,但却无法使两个声音的音色一样,处理不当还会改变音质。因此,出现音色不统一的情况后,只能进行重新录音。

2.5 多种问题并存

实际录制完成的声音文件中,有时会存在两种及以上的问题,虽然我们可以针对每种问题进行分别处理,但后期处理过多,必然会对音质产生损害。因此,当录音文件中存在多种问题或存在的问题无法通过后期技术手段弥补时,只能进行重新录音。

3 小结

录音是一项综合性的工作,语料库建设中进行录音的目的是清晰地记录发音人的原始声音,使语言以语音这种“原态”方式永久保存[4]。录音过程中需要根据录音的使用目标确定录音程序,对每一个细节进行反复研究,采取相应的录音方法和技巧。有声语料库的建设,不仅要求采录人员具备较高的录音艺术与技术水平,还需要有较为理想的录音场所、配套的录音器材,更离不开发音人的配合。

参考文献:

[1]戴春风.使用Adobe Audition修复破音[J].音响技术,2012,(6):49-50.

[2]丁瀛.浅谈Audition 在电台的主要应用[J].电声技术,2008,(7):77-79.

[3]钟立明.浅谈语音音频资料录制中易忽略的问题[J].吉林华侨外国语学院学报,2011,(1):116-119.

[4]李宇明.论中国语言资源有声数据库的建设[J].中国语文,2010,(4):356-363.

6