数字音效的“领航员”详解SACD音效技术

技术大讲堂

想在家里听自己喜欢的明星真实声音吗?CD能展现出明星的原音吗?不能,DVD-Audio也不过是一个量变质不变的声音格式。现在还是买一张让你真正与明星零接触,聆听美妙原声的SACD碟。有兴趣的朋友可以去买一张《罗文25》SACD碟来听听它与CD的区别。

随着音频市场不断迅速发展,不仅涌现出各种标准与新音频功能,而且业界也在不断地改进音质。其中SACD数字音频技术在目前各种音乐传送的体系中扮演着重要角色。

SACD与众不同

SACD全称叫Super Audio CD,即超级音频光盘系统,它是由索尼和飞利浦合作开发的一款取代CD音源的数码格式音频系统。SACD盘片的硬件结构是在DVD的前身——索尼和飞利浦共同开发的MM-CD高密度光盘上发展起来的。SACD光盘结构与DVD相似,是一种单面双层结构的碟片,直径为 12cm,厚为 1.2mm,外观与CD盘一样。

18-e-1-b.jpg

最早发布的SACD盘只有单面双层一种结构:上层为 CD层,与CD盘的物理结构和数据结构完全一样。中间由一层高密度的HD(High Density)层构成,这里的物理结构与DVD一样,数据为 SACD的高品质音频结构(图1)。其中HD层又细分成三轨,可分别载入双声道信号、多声道信号及其它资讯(如:片名、曲目、其他相关资讯或静态图档),播放时间约74分钟。盘片上的数据是这样排列的:靠近中心处为目录区,向外依次为双声道区、多声道区和附加数据区,3个区域的长短和有无都可任意处置。

18-e-1-2.jpg
图1

这种双层结构实质上是将两片不同格式的光盘重叠在一起,因此具有良好的双向兼容性。CD机可以播放SACD,读CD 层上的信息,还原出CD品质的声音。CD也可以放入SACD播放机中播放,像DVD播放CD一样,播放出的也是CD品质的声音。

显然两片“贴”在一起的盘的价格并不便宜,于是厂商们又推出了不兼容CD的单层型SACD和容量能与双层单面型音频 DVD匹敌的双层型SACD两种产品。双层型 SACD也从一面读取信息,前后有两个HD层,前面一层为透明半反射层,后面一层为全反射层。SACD的关键层当属HD层,因为这一层用650nm激光束读取,信息容量为CD层的6倍,所以对于同样只录74min内容的音乐就可以用更密的取样点、更密的量化间隔和更多的声道来表达。

不过,SACD技术的核心之处不是在其盘片结构上,而是在它所采用的录音格式上。

SACD核心——1bit DSD 录音格式

不同于传统DVD-Audio采用的PCM格式,SACD采用索尼和飞利浦专为其开发的一种编码技术——DSD(Direct Stream Digital,直接数据流),它正是SACD核心所在。与传统PCM所采用的多bit录音格式相比,DSD格式最大的特点是采用1bit录音格式。

传统PCM格式采用多bit录音系统,取样方式是把一个类比信号做垂直切割,将波形的“形状”分成许多小段,然后把类比信号做水平切割,将波形的“振幅”大小以一组多位元来代表,这就是量化的工作。取样与量化,就是PCM多位元还原类比波形与振幅大小的最重要工作。在还原过程中,PCM编码进行解码,然后按照原有的数字取样和量化规格重新转换为模拟音频。量化规格从14bit发展到16bit、18bit、20bit以及现在的24bit,取样频率从44.1kHz发展到192kHz。

20kHz频率,每秒取样44,100次够吗?这是长久以来争论不休的问题。因此当DVD-Audio制订规格时,就把取样频率提高到192kHz,同时也把解析力提高到24bit。192kHz的取样频率意味着可以完整再生96kHz的频率,这远比CD的20kHz高许多,而24bit的解析力与动态范围也比16bit大许多。不过由于CD的PCM数位录音方式必须经过取样(组合成波形)、量化(决定声波的振幅,也就是信号大小,16bit就代表2的16次方个大小不同的电压信号变化,24bit就代表2的24次方大小不同的电压信号变化)过程,所以波形重组后无法还原成原来的类比波形;由于在量化过程中难免会有遗漏相对应的电压变化,所以必须使用数位滤波器来把量化杂讯滤除。到目前为止PCM可以改善和提高的方面越来越来少,只是简单的增加PCM量化精度和采样频率,不能根本解决还原能力有限的问题,这也是PCM编码的局限性。为了突破这个限制,厂商们提出1bit的DSD录音格式。

那么DSD所采用的1bit录音格式与多bit录音格式相比又有什么好处呢?首先DSD一开始就把再生频率制定在100kHz,这比DVD-Audio的96kHz高一些。更重要的是,DSD的取样频率制定为44.1kHz的64倍,也就是2,822,400Hz,远高于DVD-Audio的192,000Hz。这么高的取样频率代表什么意义呢?很简单,44.1kHz的取样频率代表在20kHz的类比波形上取约二个点来重组类比波形,192kHz的取样频率代表在20kHz上取约10个点,而2.8224MHz的取样频率代表在20kHz上取约140个点。从再生波形的完整性考虑,取样频率越高当然越好。事实上,假若我们把取样频率换算为每取一个点要多少时间时,就会发现1bit系统取样的快速:CD 44.1kHz系统每0.0000226757秒取样一个,DVD-Audio 192kHz系统每0.0000052083秒取样一个,而SACD 2.8224MHz系统每0.0000003543秒取样一个。取样只不过代表重组波形时的完整性,另外一个重要的东西,也就是波形振幅(声音的大小)。

与PCM不同的是,DSD所采用的1bit系统不以多位元字长来代表声音的大小强弱,而是以1或0代表振幅的强度,同时这些振幅强度呈水平排列,就像一列车箱长短不同的火车。1bit系统的解码原理是:一次对1个数码位进行解码,数码信号还需要经过一个调变电路(Delta Sigma),也就是说,还需要重新排列信号,将处理过的单bit数码信号连贯起来,送1bit DAC进行解码。这样对信号的处理方式,就称为Delta Sigma方式。其原理是:先对接收的数码位进行超取样及插值运算处理(可以接收16bit~24bit数码信号),然后再进行调变电路调变,将调变数据送1bit DAC进行解码后,再转换成模拟信号输出。举例来说,一串用细绳穿起来的珠链。我们用两种方法将细绳上的珠子取下来,第一种方法是分若干次取,每次取下固定数量的珠子;第二种方法是有多少颗珠子就取多少次,每次只取一颗珠子。实际上,第一种方法就相当于多bit方式,只有接收到全部16位数码后,才进行一次解码处理。第二种方法就相当于1bit方式,一个数码位一个数码位连续不停地解码处理。对于大多数人来说,没有必要将调变电路的数学理论弄清楚,只要知道多bit与1bit的区别以及它们各自的工作方式有什么不同就足够了。

图2所示为DSD的采样过程,从图中我们可以直观地看出,在声波的波峰部分,振幅(音量)越大,数字“1”越多;在波谷地方,振幅越小,出现“0”越多。这和声波在空气中的传播方式正好对应:在波峰时,扬声器纸盆推出压缩前方的空气,空气密度增加;在波谷时,扬声器纸盆拉回,使空气密度降低。DSD很好地模拟了扬声器在空气中形成的声波的情况。由于取样次数高,所以取样过的波形很圆润,比较接近原来的模拟波形。由于不采用多位,节省位转换程序,降低了因为数字滤波而可能产生的失真与噪声。还有,由于不像多位系统般容易(位越高就越容易)受到电源或外部干扰的影响,因此理论上质量会比较稳定。

18-e-1-4.jpg
图2

加密防盗更严格

为了避免盗版,SACD采用了非常严格的防盗版措施。首先,SACD碟片对所录制的内容进行加密——在碟片的制作过程中就进行特殊的信号处理,加入肉眼不可见的物理水印,在SACD播放机上可自动检测。非法拷贝的盗版碟片因不具备这种物理水印而无法被播放机识别,此举可以防止数字信息被非法翻录。另外,SACD碟片对所录制的内容进行了加密处理,要解读加密后的内容所需要的“关键码”隐藏于上述不可见的物理水印中。SACD播放机在检测出不可见的物理水印的同时,取出关键码进行解读,并用此关键码相对应的内容进行解读。再者,SACD碟片的HD层内还录制了SACD识别标记用以鉴别碟片的真伪。此外,在SACD碟片上还印有可见水印,只要以一定角度的入射光照射碟片,水印就会显现出来。

不管怎么说,SACD并非要取代现有CD规格,而是为提高音乐质量而设计的。对于玩高保真音乐为主,特别是以追求音质音色的至真至纯为目的的朋友而言,SACD绝对是你理想的选择。

小知识:数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的,实现这个步骤使用的设备是模/数转换器(A/D),它以每秒上万次的速率对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本。将一串样本连接起来,就可以描述一段声波了,把每一秒钟所采样的数目称为采样频率或采率,单位为Hz(赫兹)。采样频率越高所能描述的声波频率就越高。 对于每个采样系统均会分配一定存储位(bit)来表达声波的声波振幅状态,称之为采样分辨率或采样精度,每增加一个bit,表达声波振幅的状态数就翻一番,并且增加6dB的动态范围态,即6dB的动态范围,一个2bit的数码音频系统表达千种状态,即12dB的动态范围,以此类推。对应144dB的动态范围,采样精度越高,声波的还原就越细腻。(注:动态范围是指声音从最弱到最强的变化范围,人耳的听觉范围通常是20Hz~20kHz。)