执行话音指令的汽车音响系统 - 1992年第11期

现代汽车强调舒适、方便、高速、安全。而舒适又绝对离不开音响系统。近年来，国外的汽车音响系统，已从简单的型号，发展到先进的、多功能的高档产品。然而，高档的汽车音响，由于功能复杂，开关繁多，不仅会给汽车车身的有限空间增加安装困难，更使人颇费踌躇的是势必还会影响到驾驶员的注意力：为了摸索、按揿音响系统键钮的准确位置，驾驶员常常不得不从方向盘上腾出手来，或者目光注意力离开地面……而这也就往往容易造成行车事故。

在汽车音响系统中能不能采用话音识别技术，代替手动的键钮操作呢？这自然成了厂商们孜孜追求的目标。但是这在行车噪声、旅客谈话声、突然的交通杂音乃至汽车音响系统输出的音乐声不绝于耳的汽车环境中，绝非容易之事。

据JEI杂志1992年3月号报道，日本三洋公司已成功地开发了用于汽车音响系统的话音识别印刷电路板（Voice Recognition Module）。印刷电路由话音频率分析IC、话音识别LSI和SRAM构成。电路板尺寸为30×70×12mm。

图1是话音识别汽车音响系统的方框图。三洋话音识别系统内定21条指令，其中：CD方式7条，调谐器方式12条，磁带放音方式10条，交通信息方式3条（见表）。用户使用话音识别系统，首先要将这21条指令输入话筒，系统即刻自动进入识别用户话音的状态。用户只要喊一声执行某一方式的话音指令，系统就作好了识别该方式各条指令的准备，并随时实施到位，响应时间小于10秒。话音识别原理如图2所示：话音分析混合IC，对来自话筒的话音波形进行频率分析。为了防止噪声干扰，定向话筒的位置距离用户的嘴巴不要超过10cm。话音识别LSI的作用，是进一步对话音的波形图加以识别，并将其储存在SRAM中。执行话音指令时，系统又将话筒输入的话音转换成波形图，并与原来储存在SRAM中的话音指令波形图进行比较识别，作出取舍判断。

那么，在各种噪声充斥的车身中，话音识别系统又是如何做到准确无误的识别判断的呢？这主要归功于三洋公司采用的增强电平的自适应分段方式（enhanced level adaptive segmentation method），进行检测识别。这种增强电平自适应分段方式的原理是，把音响系统输出的音乐电平，馈入话音识别印制电路，使系统确立起适应自己的判断标准，以减少话音识别中的误触发或检测错误。如图3所示，当汽车环境安静无音乐声响起的时候，话音识别系统可以很精确地检测出目标话音T1（图3中例1）；当车身内响起音乐声时，采用一般的话音识别系统，很容易把音乐声当成话音指令T2（图3中例2）；三洋系统则不然，由于采用了检测话音波形的门限值，随音响系统输出的音乐电平的变化而变化的自适应分段方式技术，确保了目标话音T3的检测（图3中例3）。（陆正煌）