历史录音是国家的文化艺术财富。中国各地方戏曲、民歌民谣种类繁多,有价值的历史录音浩如烟海。对这些极富价值的历史录音资料进行挖掘、修复、再版、发行,是保护与传承民族文化艺术瑰宝的重要手段之一。《昆曲音响总汇》是中国艺术研究院前头的国家重点项目---《中国昆曲艺术大典》中的一个子项目。它是对将近100小时的昆曲历史录音施行"模-数"转化,再进行数字音频修复,并配上唱词文本,最后再集中出版发行的项目。安徽文艺出版社承揽了这个项目中除"模-数"转化之外的其他任务,笔者则有幸参与到其中"数字修复"的流程中。在这套庞大的录音素材中,有近20小时的素材诞生于录音技术发展早期的声能录音时代。
本文即是笔者对这部分录音素材进行数字修复的总结。
一、声能录音的听感
声能录音是录音技术发展的最早一个阶段。所谓"声能"录音,就是指在录音阶段,不依赖电能将声音信号放大后再记录到载体上,而是通过声音能量直接驱动刻针在载体(锡箔纸筒、腊筒,或虫胶唱片)上刻下声槽。这种纯机械方式的一大弊端,便是由于声能的能量不足,造成许多声音细节无法被记录下来。当时的工程师也意识到声能不足的问题,于是在刻纹针前端安装上大喇叭,用以聚拢和增强声能。所以当时的表演艺术家必须在录音时靠近这个大喇叭,不能有太多身体动作,才能尽可能多地录下声音细节。个别乐器还会在结构上被改造,已得到更大的音量。如图1,就是一把为得到更大录音音量而改造的号角小提琴。
尽管如此,与之后的电气录音相比,声能录音的音响效果依然有极大的缺陷。它音质粗劣、噪声夸张、频响范围狭窄,这些特性让声能录音在今天听起来具有十足的特点。图2是声能录音和电气录音的频响曲线对比,虚线是声能录音频响曲线,实线是电气录音频响曲线。可以看出,声能录音比电气录音的频宽窄,只有250Hz至6000Hz左右,而电气录音则达到100Hz至5000Hz左右。另外,在有限的频宽内,声能录音表现得非常不平坦,1000Hz至4000Hz的能量要远高于其他频段,这正好勾勒出它"电话"般的音色。
二、录音修复的具体方法
任何声音节目的制作,都要在音响上尊重节目本身的声音形式。因此修复组在动手操作前对昆曲的音响形式做了深入了解,并以此为依据形成以下修复原则:
1.尊重昆曲音响特点。昆曲的伴奏乐器比较齐全,其中,"笛"占有极其重要的地位,有时甚至与演唱者的声音平分秋色,其他重要的乐器还有板鼓和笙。这些声音元素在昆曲录音修复中需要格外足够重视。
2.修复过程不仅仅局限于"降噪"处理。虽然噪音是历史老录音的一大声音特点,但老录音的音色和动态也是不完美的,它在一定程度上也是可以修复的。有些老录音会因为当年录音师的操作失误,而产生其他瑕疵,如话筒位置不合理而导致的声音层次不合理、空间感不理想等,这些瑕疵在声音修复的过程也需要整体考虑。
3.尊重历史录音原貌和历史录音爱好者的听音习惯,不过分修复。历史录音的修复要"点到为止",一旦过分夸张,就会起到相反作用,音响甚至更加糟糕。有了上述原则思想,我们就进入到修复工作中。如前文所述,声能录音有明显的本底噪声和爆裂噪声,信噪比很差,频率范围窄,信号清晰度也不理想。
这些问题需要在数字修复中逐一解决。
(一)本底噪声的修复
声能录音中的本底噪声,主要来自唱针与唱片的摩擦,以及录音设备本身的机械震动。而把原始的声能录音唱片转录到现代载声媒介(如聚乙烯唱片或磁带)时,可能还会在录音中添加轻微的交流电噪声。通过对比发现,如果底噪中存在交流电噪声成分,那么使用降噪器一次性衰减所有本底噪声的效果,不如先衰减交流电底噪,再衰减摩擦及震动底噪的效果好。
由于转录的情况不同,所以并不是所有的历史录音都含有交流电底噪,因此首先需要确认其是否存在。素材中有些声能录音的转录工作是在解放前进行的,当时我国的交流电还没有统一的标准,既有50Hz交流电,也有60Hz交流电,这就需要我们对交流电噪声频率进行分辨。有些降噪软件是专门用来衰减交流电噪声的,例如:Waves公司的X-Hum、Wavearts公司的MrHum,以及IzotopRX系列中的De-Hum功能等。这些插件的预置功能已经为用户准备好了衰减50Hz或60Hz交流电底噪的参数,只要选择预置参数,反复切换"旁通"并仔细听辨声音的变化,就能够确定底噪中是否含有交流电底噪的成分了。图3是Wavesarts公司的MrHum,这是一款专门用来移除交流电底噪的插件。点击"Pre-set"键,便可弹开一系列实用的预设参数,选择其中的"50HzHum"或"60HzHum"便可有效衰减素材中残存的交流电噪声,而一般情况下,插件面板上的其他参数无需额外调整。
由于声能录音的频率范围较窄,其低频下限一般在250Hz以上,远高于交流电频率(见图2),而"MrHum"这类插件对频率的衰减均使用窄频带处理,即便是衰减交流电基频的谐波成分,也不会对有用信号产生可闻性影响。交流电噪声之外的其他底噪声多是摩擦声,它与唱片材质、刻纹头和放音头材质、唱片母版材质等有关。在实际操作中,这种摩擦底噪可以使用"De-noise"类降噪插件进行处理。
比较有代表性的"De-noise"插件有:Waves的X-Noise和Z-Noise、Wavearts的MrNoise、Sonnox的OxfordDenoiser等,另外,iZotopRX3的Denoise功能效果也很好。"De-Noise"类降噪插件的工作流程为,首先提取噪声模型,再根据可调整的"噪声门限"和"噪声衰减量"进行降噪。提取噪声模型既可以手动也可以自动。手动提取可以获得最准确的噪声模型,但它需要素材中有一段只有底噪、没有节目信号的片段,并且这个片段的时长最好在2秒以上。另外,整个节目中的底噪需为稳定不变的,才适合用手动提取底噪。
图4是著名的"牛津"降噪插件。面板上"De-tect"区域就是噪声模型提取区,需要进行手动提取时,点按"Manual"键,然后循环播放噪声片段,就能得到噪声模型。
有些素材中并没有纯粹的噪声片段,这就需要使用自动噪声提取功能,如WavesZ-Noise中的"Extract";如果素材中的底噪并不稳定,即噪声音色和音量时不时地会发生变化,就要打开降噪插件中的"自适应"功能,如Z-Noise中的"Adaptive",或OxfordDe-Noiser中的"Auto"键。我们发现,某些老唱片由于年代久远,唱片表面某些区域的噪声与其他部分相比,会有显著不同。那么,当唱片旋转,唱针每圈划过这篇区域,底噪都会发生变化。因此在这种情况下,降噪插件中"自适应"选取噪声模型的功能在历史录音修复中是比较有用的。
得到噪声模型后,就可以使用噪声门限(Threshold)和降噪衰减量(Reduction)来对本底噪声进行实际衰减了,这两个参数是降噪插件中最常见的。"门限"设置了底噪与节目信号之间的分界线,只有在"门限"以下的信号才会被降噪器衰减;"衰减量"是降噪器衰减"门限"以下信号的量。这两个参数是配合使用的,但它们的调整需要把握一个"度",不可过分降噪,否则不但会产生一个与历史录音极不相称安静声底,还会严重影响信号音质,同时产生混叠失真(一种听起来"咕噜咕噜"的声音),从而彻底毁掉一段历史录音素材。
声能录音的信噪比很低,并且信号和噪声较严重地"纠结"在一起。我们从实践中发现,在降噪插件直接探测出的噪声模型中,还含有不少有用的信号。直接使用这样的噪声模型进行降噪,会很明显的破坏历史录音原有的音响质感。其中最明显的区别,就是降噪后的音响会比降噪前"闷"和"暗",没有光泽。这说明降噪器对原信号的高频衰减过量了。对于昆曲来说,高频恰恰是特别重要的频段,它不仅表现人声质感,更是昆笛和板鼓敲击感的频段所在。要解决降噪会侵袭高频这个问题,可以通过对噪声模型频响曲线高频进行修缮,让降噪器不在高频做过多衰减,宁愿有一些高频底噪,也要保留昆笛的嘹亮;或者,先直接使用未经修整的噪声模型把整体噪声降下来,再通过均衡器和激励器对过分衰减的音色进行弥补。经过对比,笔者发现,单独使用任何一种方法,都不如二者共同作用的效果更好。
由于声能录音的频宽较窄,信息主要集中在4000至6000Hz,所以可以将噪声模型曲线在上述区域做些修整,减少这个区间的噪声衰减量,从而减少有用信息的流失。图5是Waves公司的降噪软件Z-Noise,其中的白线是对昆曲录音作品《蝴蝶梦》进行噪声模型采样后得到的。但该噪声模型中还包含许多有用信号,如果直接使用该噪声模型对原素材进行降噪处理的话,结果会非常不理想。通过对3314Hz做13.9dB衰减,使这一频段噪声模型的门限更低,从而让更多的有用信号留在门限之上。这样虽然该频段被衰减的信号就会少一些,但更完整地保留了该频段原始音质。尽管如此,将处理后的音频与原始素材相比,还是会觉得"闷"一些。这就需要在之后的步骤中,再对音色音质进行补偿。
(二)爆裂噪声的修复
当唱针划过唱片上的裂纹、划痕或灰尘时,就会发生爆裂般的噪声,有人形象地将这种声音称为"蹦豆儿声".根据爆裂声的持续时间,人们还将之做了更细致的划分:如Sonnox公司就把持续时间在2毫秒到10毫秒的爆裂声称为"Pop",把0.1毫秒至3毫秒的称为"Click",把0.4毫秒以下的称为"Crackle".值得注意的是,各个公司都给爆裂声作了分类,但他们标准却不太一样,比如Izotop公司就认为10毫秒以内的叫"Click",而更长的爆裂声是"Crackle".
对于录音效果较好的老录音来说(如电气录音时期的产品),衰减爆裂声的降噪插件操作起来并不麻烦,如图6,只要设置好门限(Threshold)和灵敏度(Sensitivity),就可以对所有的爆裂声一次性衰减。但是,用这种方法对声能录音时期的昆曲老录音进行处理,就会发生很大的问题。昆曲中板鼓是非常重要的伴奏声部,从音响层次上来看,板鼓仅次于昆笛,处于整体非常靠前的音响层次上。但在声能录音时期,昆曲中的板鼓不可能被录得很清楚,而是微弱地"隐藏"在一片底噪声中,隐约能听见它的"滴答"声,其强度远不如某些爆裂声大。在素材中有一段录制于1903年的昆曲老录音《思凡》,它就是这种情况的典型代表。图7和图8是把《思凡》导入iZotopRX2后的声谱截图,RX2这种火焰般的声谱可以显示出爆裂噪声,即一种颜色较深的笔直的竖杠,图7用红圈标注出的就是爆裂噪声。但《思凡》中微弱的板鼓,在影像上与爆裂声无意,如图8.在这样的情况下,使用固定门限和灵敏度后,软件很可能把板鼓敲击当作爆裂噪声,删得干干净净。
为避免发生这样的情况,就要在删除声能录音时期的昆曲老录音中的爆裂声时,仔细听辨短暂的"滴答"声到底是噪声还是板鼓,然后使用手动方法逐个删除。虽然这会降低效率,但却十分值得。至于衰减爆裂声的"力度",应以恰好衰减到听不到爆裂声为临界,而不可千篇一律地使用最强的衰减灵敏度,否则可能会破坏背景声的连贯性。
(三)音色的修复
对于历史录音来说,除噪音之外,对其音色的修复是必要的,因为早期录音设备与声音载体的音色很差,并不能忠实反映声源音色;并且多年存放后,载体的音色还会进一步劣化;前期的降噪处理会对素材的音色,尤其是高频有一定衰减。
针对以上问题,我们可以使用激励器来进行频谱拓展。需要指出的是,激励器的参数调整应"保守"一些,因为它不但能激励出有用信息的谐波,也能激励出噪声的谐波。图9是著名的BBEH82激励器,它不但能激励高频,也能激励低频。在昆曲历史录音修复中,一般不使用低频激励功能。"HiTune"是对所激励高频的基频选择,"HiMix"是激励强度,它一般调整到2~5时效果最好。
除激励器之外,均衡器是修复音色时最常用的设备。当使用激励器之后,再使用均衡器进行进一步调整,才能更全面地对原有频率和被激励出的新频率做整体把控。
均衡器的调整比激励器更灵活,每一部录音制品需要不同的参数调节,才能达到相对"均衡"的音色结果。图10是用McDSP公司出品的GEqualizer对1903年昆曲老录音《思凡》进行均衡处理的参数调整。看似陡峭的调整后,却可以得到相对平整的频谱。增益衰减的量可以稍微保守一些,尤其是在增益提升时,提升量太高,反而会把底噪也带出来。
所以在处理《思凡》这部作品时,均衡增益的提升量被严格控制在6dB左右。
还有个别老录音是多年前转录到磁带上保存的,长年存放后,不但磁带音色会发生变化(高频衰减,更闷),还会产生复印噪声效应。电能录音时期的复印噪声是可以通过多种手段将之衰减的,但声能录音时期的老录音转录到磁带上后产生的复印噪声,相对底噪来说十分微弱,笔者及同事们尚需要继续研究。
由于每一段历史录音的声底都是不一样的,所以数字化修复的具体参数设置也是不同的,依据在昆曲历史录音修复实践中总结出的点滴经验,笔者做以如下总结:昆笛和板鼓在昆曲中有极为重要的地位,修复中应予以足够重视;底噪衰减不是唯一的工作,另外,衰减底噪要适可而止;爆点噪声需逐个手动衰减;可以以昆笛和板鼓的音色为参照,去调整人声及整体的音色。
参考文献:
[1]约翰·厄格尔。录音[M].北京:中国电影出版社,1986.225-229.295-297
[2]李万海录音音响学[M].北京中国电影出版社,1984:5-40
[3](美)迪特玛。音乐录音从"零"学[M].北京:人民邮电出版社,2013:12
[4]周小东。录音工程师手册[M].北京:中国广播电视出版社,2006:167-205
[5](美)凯斯。声音制作效果器[M].北京:人民邮电出版社,2010:127-134
[6]谢倍伟。老旧录音资料的修复[J].音响技术杂志编辑部,2011(2)。
[7]王丽楠。浅论音响美学[J].大众文艺,2012(3)。
[8]王雨桑我国钢丝录音遗存音乐音响档案样本测试与音频还原研究[博士学位论文][D].北京:首都师范大学,2009年。
[9]周兵。昆曲六百年[M].北京:中国青年出版社,2009114-128.
[10]熊姝。昆曲表演艺术论[M].沈阳:春风文艺出版社,200525-36.