让每一部汽车都能听会说

事件

未来,每一部手机、汽车、家电、玩具都能听会说……

“这并不遥远,也就两三年。”3月下旬,在科大讯飞举办的语音开发者大会上,科大讯飞董事长刘庆峰博士对本报记者说,语音合成技术将改变人们的收听方式。

语音是人类最自然沟通方式

出现在语音开发者大会现场的李开复表示,多年前盖茨就说过语音会改变世界。为什么一直没有改变?“一是云计算还没有达到那么高的水平。二是我觉得语音在过去二三十年总是不知道应用在哪里。”李开复认为,语音是人类最自然沟通的方式,人们一旦开始用语音跟机器交流了就会把手机、电脑等终端当成人,用户非常高的期望值给开发者带来很大的挑战。

很多人想到语音就想到语音识别,其实还有语音合成。刘庆峰认为语音识别是第一位,目前业内语音识别准确率已经达到90%以上。第二是语音合成,自然度超过真人发音水平,任何一篇文章拿来无论是汽车还是电视读出来都可以达到真人水平。

具体到科大讯飞“语音云”及“讯飞语点”这样的产品上,在语音合成、语音搜索、语音听写能力的基础上,加强了自然语言理解、个性化语音识别、个性化语音合成、声纹识别、口语评测等新特性,让语音应用迅速扩展到用户生活中。现场演示中,刘博士的指令,提醒会议、找餐馆等,手机正确理解4条,错误两条。而如果用户丢了手机,即使别人碰巧知道开机的语音密码,只要不是手机主人说出来,捡手机的人也打不开手机锁。

各大公司发力语音技术

越来越多的公司认为,语音合成技术将改变人们的收听方式。3月初微软亚洲研究院展示的最新成果中,也有一个“将单一语言的文语转化变为混合语言”项目,可利用一位说话人的单一语言录音合成出不同语言的训练语料库,以此构建统计模型的多语言的文语转换系统。

网友Elfei2012 分享了一个语音应用的故事:一个瑞士的老头和一个重庆的姑娘,一个不会说中文,一个不会说英语。但是,通过谷歌翻译,他们在一起了,语言障碍、地域分隔,就更不再是问题。

对于电脑和手机上的语音应用,大众点评的语音搜索、知乎网站的语音问答,都有大量用户在体验,充分展示了应者云集。百度技术副总裁王劲在3月23日的百度开发者大会上,也透露百度的语音输入服务将在今年底推出,API将提供给开发者。

至于汽车能听会写,现有的语音系统结合导航软件,车主只要说导航到××地,就可以自动导航到目的地,开车时,还可以语音点播歌曲、说给某某打电话,自动拨电话、实现语音搜索。