输入法的智慧
访谈

专访微软亚洲研究院创新工程中心高级研发主管、微软英库拼音输入法研发负责人Matthew Scott
在键盘上输入中文、英文,完全不用切换,就可以给出正确的中音文混合语句,比如,“林书豪太cool了”;输入文字中想加入图片,不需要剪切粘贴,通过v模式就可以加图;如果在纯英文输入的情形下,即使记不清单词拼写的情况,输入法会自动给出音近词、形近词的模糊推荐,以及通过拼音查找英文单词等方法,都可以辅助用户找到目标词汇;而且它还能根据用户目前的应用场景做相应推荐。
这,就是微软亚洲研究院近期刚推出的英库拼音输入法。
微软首次在中国 推出输入法产品
作为微软推出的第一款云输入法,英库拼音输入法融合了微软亚洲研究院的自然语言处理、中文计算、搜索引擎、机器翻译、网络数据挖掘、机器学习等方面的技术。
这也是微软中国首次在中国推出输入法产品。据悉,该输入法是由微软亚洲研究院与微软中国Office商务软件部用了不到1年的时间联合研发的。目前,微软英库拼音输入法首先面向Windows 7和Windows 8桌面版用户开放使用,并将在后续版本支持Windows XP用户。
对于英库拼音输入法,微软亚洲研究院院长洪小文博士认为:“它集合了微软多个部门的智慧和努力,超越了人们对于传统输入法的认识,诠释了输入法的发展趋势。微软亚洲研究院希望能够通过研究院的创新机制把我们的先进技术尽快带给广大用户。”
然而让用户意想不到的是,负责英库拼音输入法产品研发的Matthew Scott却是一位不会讲中文的美国人。 微软亚洲研究院创新工程技术总监田江森博士解释说:“之所以让Matt负责,是因为从6年前认识Matt并亲自带他到中国, Matt给我的印象一直是一个热情的研发狂人,而且他还是研究院里很有人缘的‘公关高手’。当项目需要其他部门支持时,Matt一出面,总是能很快搞定。Matt其实起到的是一个胶水的作用,把所有专家的知识粘了起来。”
“Matt不懂中文有什么关系呢?这个主要和技术有关,怎么样写这个程序,用什么样的框架来做才会快速实现,云端和客户端两个的分割,以及如何减少中间不必要的来回转换。这些东西其实跟语言关系比较小,但是跟技术关系很大。”田江森博士认为在输入法项目上,技术才是关键。
不懂中文的负责人
电脑报:Matt,看过你讲述的“东游记”,从美国总部到北京工作后,取得的进步都归功于同事们的帮助,难怪你人缘好。为什么微软还要做输入法这样的成熟应用项目?
Matthew Scott:谢谢你的好记忆。
一个很大的原因是研究院前期的大量技术积累。我们之前在云端的自然语言处理方面投入了很大心血,而且我们有机器学习、海量数据挖掘的成果,加上自然语言处理,这些东西当时被用到了必应词典当中。对于我们来说,下一步很自然地就把它推进到与用户更接近的输入法。
我们整个研发过程中与很多来自不同领域的组在合作,在多元化氛围中讨论,整个过程非常有趣。
电脑报:因为Matt你不懂中文,对这个输入法究竟是不是好用,或者说用户使用的体会,你这边体会不是那么的深刻,怎样在这个产品的引导上给它定位呢?
Matthew Scott:我们有一种模式叫 “以实践为驱动的研究”,使用这样一种模式我们能够解决任何问题。包括当我们被招进研究院的时候,我们并不是被招进来解决某一个特定的问题的,通过这样一种解决问题的思路,任何一个问题都呈现出一般化的分解,简单来说就是有一套问题解决方法。
用户体验主要依靠团队。因为团队会在各方面看用户的使用体验,包括这个软件到底对一些词汇输入有什么结果,会不会是非常理想的结果。团队的反馈,可以帮助我解决语言方面的问题。
我们有一个非常特殊的团队,有研究院的,有Office产品组的,有语言学的老师,它是多元化的。这样一个团队爆发力很强大,所以我们才能够在这样一个短时间内做出很多的东西。
电脑报:英库输入法还强调是云端输入法,在输入法图标上有一朵云,有时候输入过程中,一些备选字上也有云朵标记,云输入的好处可以概括一下吗?
Matthew Scott:有云标记的备选字表明来自云端。云计算是微软的未来,我们在云端可以有更多的内存、可以有更多的数据、可以有更多的资源去查找海量的数据。这样返回来的结果必然是更准确。如果你连上网络,输入时我们就会给你云端的建议,如果你没有联网、没有云的话,输入法的功能同样不受影响。
特别是在输入英文时,有时候某词记不清了,云有强大的纠错功能,可以给出提示。这样的特性是我们所独有的,没有任何其他输入法能够做到这一点。
电脑报:可能在当初开始这个项目的时候,列了很多输入法要实现的功能,不知道在研发过程当中,是不是有些功能暂时给它去掉了?如何决定取舍?
Matthew Scott:实际上,会有很多因素来决定我们的取舍。当我们取舍的时候,永远是把用户真正需要的东西放在最高的位置上。
另一个帮助我们做决定的视角,是看看微软有哪些强大的资源,比如说我们有必应搜索、一个强大的自然语言处理团队、机器学习、海量数据挖掘,然后我们有Office产品组强力的支持,把我们的强项列出来之后,基于这些作出我们的决定就变得比较自然了。但是最终我们还是要有严格的产品流程来把关的。
例如考虑怎么去整合搜索到IME 端的时候,就提出了这样一个设想:这个设想也是我们独创的,叫做场景感知的输入,就是输入法能够知道你目前在什么样的场景之下,并且能够呈现出特定的适合这个场景的行为。在QQ下聊天,与用Word写文档给出的备选字和图就不一样。
另外我们发现在聊天的场景下,一个最常用的需求就是表情符号,或者表达你的情绪,但是我们传统的表情符号是静态的,是一个有限的集合。我们通过实时的搜索就可以把海量的可以表达的图片呈现到你的输入法这边来。现在我们公司内部用英库输入法的人,开始写邮件的时候也经常用丰富的图片来表达自己的心情,所以说很多邮件都变得图文并茂了。
我们也非常关心中国用户特定的需求,所以我们也做了皮肤,我们注意到对于输入法来讲皮肤也是目前标配的一部分。