未来,和那些“非人类”侃大山——专访日本人机对话之父德田惠一

趋势

与机器人随心所欲聊天,这样遥不可及的梦想就快要变成现实了。2010年日本高新技术博览会,参观者将能够与流行的 3D 角色逼真对话。这都归功于名古屋工业大学的语音处理实验室打造出的一款可在个人电脑上运行的语音互动系统——MMDAgent。

42-a12-01.jpg

这一研究成果立即引起了记者的兴趣,记者也在第一时间采访了担任开发工作的名古屋工业大学国际声音技术研究所的德田惠一教授。

电脑报:机器人不论问什么都能回答吗?

德田惠一:用简单的词语来问它就可以,还请高抬贵手,别用长句子折磨它。

电脑报:我看脚本里还有“你喜欢什么连续剧”、“你喜欢什么帅哥”这样的问题呢?

德田惠一:这次展览所用的DEMO程序只放了大家可能问的最多的问题,比如“你几岁啦”、“家住哪里啊”这样的简单问题。

电脑报:它会区别周围的噪音和别人说的话吗?

德田惠一:现在还不行。不过声音辨识引擎在技术上来说是可以提高它的辨认精度及抗噪能力的。现在的机制是很基础的:一定范围内的声音响起和结束就是整个辨识的目标。

电脑报:怎么收集MMDAgent说话的声音呢?

德田惠一:我们会拜托专业录音棚来进行全程录音,以达到最好的效果。而声优的话,我们采取选拔会的形式,从已经报名的20多名声优中选出3位来担任。她们的声音,不能太动画化,也不能太现实化,中间一点最好,能给人一些幻想。录音好的数据将用HTS声音合成软件处理后形成的波频,配上汉字和片假名文章发音,将这两者混合起来加载给MMDAgent。

电脑报:能给我讲解下这个软件是如何运作的吗?

德田惠一: 那我给你举一个具体的例子吧。当听到“早上好”这句问候时,进行脚本辨识以后就同时触发对应的指令单,运行各个动作、声音文件,形成连贯的动作。首先,保持原来的身体状态——可能是站着,也可能是在走路。然后,启动声音文件,发出问候的语句。同时,表情动作文件启动,它眉毛随着说话的节奏动起来,做出非常高兴的表情。当然,我们还做了很多有趣的动作文件和指令单,并对照各种环境和各种状况设计了及时和正确的反映,让人产生“正在和它对话”这种感觉。

电脑报:这是以制作游戏为前提进行开发的吗?

德田惠一:这个程序不仅仅能用于游戏开发。更多的,比如主题公园、无人导游等方面的使用前景是很广阔的。它可以随着程序开发者的愿望变成各种有趣的程序供大家使用。