Wolfram Alpha真会终结谷歌?
热点直击
似乎是一夜之间,Wolfram Alpha成为了备受关注的明星,还未正式露面,就被冠以“谷歌终结者”、“谷歌杀手”、“伟大的技术创意”等一系列炫目的头衔。如今,Wolfram Alpha已经揭开面纱来到大众面前,它是否真的能承担起如此多的光环呢?
有趣的Wolfram Alpha搜索结果
和一般的搜索引擎一样,Wolfram Alpha的首页也只有一个输入框,用户可以在里面键入感兴趣的关键词并敲击回车键,得到一个结果。不同的是,Wolfram Alpha给出的结果并不像传统搜索引擎那样由很多个在Web页上搜索出来的网页地址组成,而更多的是一种对用户输入内容的“答案”。
比如,如果用户输入了“China population”(中国人口),Wolfram Alpha就会立刻“理解”用户输入的意义,并马上给出一系列有关中国人口的数据,如人口总数、人口密度、人口增长率、性别分布等。这些数据以数字、表格和图表等多种方式呈现,全面而详尽,对于想了解“中国人口”相关知识的人来说,这些数据至少是部分地回答了这个问题(图1)。

再比如输入“dell apple”,你将得到一系列对比图表,内容涵盖这两个品牌从产品价格到产品销售走势的各个方面。
相比传统搜索引擎会给出一大堆网页,让用户自己去寻找结果的方式,这种直接对用户的输入给出答案式的运作方式令人耳目一新。
多年以来,用户已经习惯了从成百上千个网页搜索结果中费力地查找自己想要的信息,Wolfram Alpha让我们看到了一种更好的方式:搜索引擎不仅能够找到原始的信息、组织这些信息,而且能够以构造出来的答案形式将结果给出。难怪Wolfram Alpha自称“知识引擎”:它拥有的不仅仅是材料,还有从材料中提取出来的信息,也就是“知识”!
计算型知识引擎:语义分析的强大和局限
Wolfram Alpha如何能够拥有这样神奇的力量?这还要从Wolfram的身世说起。Wolfram公司有一个在科学界如雷贯耳的产品Mathematica。Mathematica在科学计算领域中的地位就相当于图像处理领域中的Photoshop或是工程设计领域中的AutoCAD,可以说是把数学领域中的问题解决方案一网打尽,不仅有着一个完备的编程语言和集成开发环境,并且有数以十万计的专用工具包的支持。Wolfram,在西方的科学计算界几乎就是“数学”或“计算”本身的代名词。
Wolfram Alpha作为Wolfram公司的知识引擎产品,对于“知识”的理解,当然有着很深的科学计算的背景。Wolfram Alpha的运作原理其实说起来一点儿也不难理解:它把所有的输入都看作是一系列原始数据和数学模型的组合,然后,把所有的输入按照某种方式关联起来,就得到了答案。
仍以“China population”为例,对于“population”(人口)建模,它知道有关“人口”需要给出总数、人口密度、人口增长率、性别分布这些结果,而这些结果都可以通过某些数学模型计算出来。然后,它又看到了“China”,于是在计算模型中加入了一个“国别约束”,也就是说,并不是其他国家的人口而是“中国”的人口。于是,它在数据库中找到一系列的原始数据,经过一组计算,就给出了最终的结果。
请注意,这里的搜索引擎和传统的搜索引擎有两点本质的不同。第一,传统搜索引擎对于用户输入的内容只是做简单的字符串匹配,而未能真正地做到“用户的输入究竟是何意义”的发掘。诚然,字符串匹配能够看作是输入相关的知识搜索,但这种搜索的关联性毕竟是非常弱的,它常常会给出很多只与输入的部分相关甚至风马牛不相及的结果。
但Wolfram Alpha却在输入分析的过程中下了一个很关键的工夫:它把输入的关键词当作一个个的“语义单位”,也就是数学模型,并将它们组合起来形成一个完整的“语义表达”,也就是最终的结果。只要接触过计算机科学相关专业的人都知道,这后面需要进行的计算量是多么大。
第二,传统搜索引擎本质上只是把互联网上或是维基数据库中已有的内容根据字符串匹配的结果原样返回给用户,可以说是基于历史积累,或顶多是带了一些资料相关性分析的“智能”在内的一种“字典查询式”的服务。
但Wolfram Alpha却从根本上颠覆了这个概念,它给出的结果不仅包括了大量的历史结果,还包括了这些结果之间的即时数量分析,比如对比、线性规划、各种数学期望、最大值最小值和统计学结果等等。
更重要的是,它还可以给出基于坚实计算和可靠模型的未来趋势结果。可以说,传统搜索引擎和维基给用户的结果是“找出来的”,而Wolfram Alpha是“算出来的”。实质上,与其说Wolfram Alpha是什么“知识引擎”,还不如说它是一个“计算引擎”,或直截了当地指出它的本质:它是语义引擎的一个新阶段的雏形。
Wolfram Alpha的强势在于数学模型,这是它理解“知识”的根本。对于“population”(人口)、“GDP”(国民生产总值)这样能够很好地量化的输入,它给出的结果不但相当全面,还包含了很多基于分析的知识。但它也有明显的局限,对于“fall in love”(陷入爱河)和“Shakespeare poetics”(莎翁诗作)这样难以用量化结果呈现的输入,它就一筹莫展了。
“谷歌杀手”?一个美丽的童话
Wolfram Alpha很好,很强大。但是如果说它现在就具备了向谷歌挑战的实力,那的确是为时太早。没错,Wolfram是说过“要打败谷歌”这样的话,但是它并不是要通过改进搜索结果的方式打败谷歌,而是要另辟蹊径,根本不用“搜索结果”这样的传统方式来响应用户的输入。
事实上,在Wolfram Alpha的结果页面上,有一个“搜索Web”的提示框,用户可以直接选择以Web搜索引擎的方式来处理先前的输入,Wolfram Alpha还给出了好几个选择:谷歌、雅虎和微软的搜索引擎(图2)。这说明Wolfram Alpha根本不把自己视作一个传统搜索引擎的竞争产品,而是一个平行产品。

这么一来,Wolfram Alpha的市场定位显然就和谷歌有所不同。作为一个计算型知识引擎,它对于“知识”的理解还停留在数学模型的层面,呈现结果的方式也是以数学图表。这对于大量需要这类图表的商务人士和科学家等专业用户的吸引力不小,但是对于大众来说,这样的形式是过于艰深了。Wolfram Alpha如果真正地成为“谷歌杀手”,在大众市场上的竞争是不可避免的,它必须进行多方面的改进才能进入这个市场,发展自己的实力。
一言以蔽之,由于历史积累还太少,加上对“知识”的语义理解的片面性,Wolfram Alpha在现阶段还只能是一个小众产品。但是Wolfram Alpha毕竟是一个知识引擎的革命性产品,它代表了重要的进步方向。
知识引擎:语义搜索的未来方向
一如前言,Wolfram Alpha颠覆了传统搜索引擎的两个重要方面:如何“理解”用户的输入,以及如何给出结果。简单的字符串匹配、对已有内容做一些以点击率为依据的浅薄分析,已经不能满足用户日益增长的需要。未来的引擎,需要更加强大的智能来武装。
首先,对于用户输入的语义理解要更进一步。Wolfram Alpha把知识理解为“数学模型”,这是一种很有意义的尝试,但是还不够。知识不仅仅是数学模型,更有着丰富的逻辑意义。比如“人口”不仅仅是一堆数字,它还有生态学意义、管理学意义等等,这些需要更强大的语义分析技术。
其次,以数学图表来呈现结果,这已经是“答案式”结果的重要尝试。但是未来的引擎将以更贴近人类自然语言的方式来给出结果。从数学到语言,这当中有很多可能性,比如形式化语言等,但最终,如果在自然语言输出方面取得重大的技术突破,这仍然是一件可能做到的事。
一个终极的目标是,用户以自然语言的方式给引擎以“命令”,而引擎运用它已经掌握的“知识”,直接给用户一个全面的、详尽的、以自然语言表达的结果。对于这个目标,目前Wolfram Alpha、谷歌等都在从不同的方向趋近。这些引擎都在企图扮演一个 “巨型大脑”的角色,集中人类的智慧,为日常生活和工作中的各种问题给出合理、智能的答案。