微软对抗谷歌出新招:语义搜索PK关键词搜索
特别策划
在网络搜索市场,微软一直在加大投入,试图缩短和谷歌之间的距离。在不放弃收购雅虎的同时,微软还在寻找更多的取胜筹码。就在前不久,微软斥资至少1亿美元收购了互联网搜索引擎公司Powerset,看重的便是这家公司的语义搜索技术。这个号称更加智能的搜索技术究竟有何魅力?微软的1亿美金投入是否物有所值呢?
语义搜索是什么
总部位于美国旧金山的Powerset公司之所以能够吸引微软的注意,得益于它在2006年推出的基于自然语言特性的“语义搜索引擎”技术,这项技术使得Powerset在搜索体验上,显得比谷歌等的关键词搜索更加人性化。
目前谷歌使用的是PageRank技术,就是通过一定的统计学方法计算用户所搜索的关键词在网页中出现的频率,从而把相关的结果返回给用户。因此在使用谷歌搜索的时候,用户必须事先提炼出要查找的问题的核心字词,然后通过一系列关键词组合才能够搜索出自己想要的答案。
虽然在绝大多数的情况下,谷歌能够给用户准确的答案,但在一些特殊情况下关键词技术会暴露出自己技术上的瑕疵。例如,如果有用户在搜索引擎中输入“哪支球队曾在世界杯中战胜过巴西队?”除非有人询问过并且回答过这个问题,否则谷歌最终的搜索结果将很可能并不是用户想要的答案,或者还需要用户再花费大量的时间,从众多网页中筛选出自己寻觅的真正答案。
语义搜索在表现方式上更具人性化,它不需要用户事先提炼、组织关键词,而是允许用户直接以能表达自己真实需求的整句话向搜索引擎“索要”答案。它能在用户输入的一句话中,提取多个关键词并根据关键词的含义和联系建立语义索引和实体关系间的概念图表,并最终找出符合人类思维的真正的相关结果。譬如搜索“哪支球队曾在世界杯中战胜过巴西队?”Powerset给出的第一个搜索结果是包括法国在内战胜过巴西的球队。简单说,它不是以“世界杯、巴西队、战胜”等关键词的匹配情况来提供搜索结果,而是试图分析、理解用户询问的真实含义。
在信息爆炸与重复度非常高的Web2.0时代,这种能够“读懂并理解”用户提出问题的自然语言处理技术将使得Powerset搜索引擎具有了无穷的魅力,也让它具备了从现有的搜索市场突围而出的条件。
微软的如意算盘
语义搜索凭借着智能式的搜索方式,被很多互联网技术专家看好,它很可能成为“谷歌的克星”。通过收购Powerset,微软认为自己能够迅速提升追赶谷歌的技术实力,尤其是当用户需要找到特别专业与详细的问题答案时,Powerset精确匹配能力的优势就会凸显出来。
对于类似谷歌这样的已经膨胀到一定体积的超大搜索引擎而言,它无法轻易地将自己的搜索方式转换为语义搜索。在经历了数年的积累之后,它们已经扫描并对许多网站的页面进行了索引优化,这些引擎目前都将自己的精力集中在每天新增的大量新网站中。而将现有的搜索引擎更换为语义搜索,需要大量的人力物力消耗,因为语义搜索所采用的页面分类和分析技术与现有技术完全不同,搜索引擎需要重新扫描分析所有的网站页面,这对于谷歌而言,几乎相当于要从头开始。
不知道是不是因为这对谷歌是一个不可能完成的任务,谷歌的管理层对于微软收购Powerset公司一直都表现得非常不屑,甚至放言说语义搜索是一项没有任何意义的技术,但显然微软不这么认为。
尽管上述困难微软也同样需要面对,但是与谷歌的搜索引擎不同,微软的Live引擎近年来一直在关注专业领域,尝试为特定的细分人群提供精准服务,以任务为中心的搜索是微软企图超越谷歌的迂回战术,而且Live搜索引擎如今已经在搜索购物、旅游、健康等专业领域拥有一定的优势,而语义搜索能够对Live搜索引擎形成有益的补充,大大提高用户搜索时的精准率。如此看来,尽管1亿美元并不是小数目,但这笔投入对微软追赶谷歌将大有裨益。
语义搜索的潜在价值
语义搜索的前景看似很美,但要完全实现也并非易事。目前的Powerset搜索引擎只针对维基大百科网站进行页面索引分析,用户还不能够在该引擎上搜索到除了维基大百科之外其他网站的内容。
这也是语义搜索现阶段需要面对的一大难题,即效率,因为在目前的技术条件下,服务器中的每个CPU需要平均耗费20秒的时间来分析网站中的一个页面,这也是语义搜索的最大弱点。所以就目前来看,语义搜索更适合应用在具体的网站而不是整个网络上,要像关键词搜索一样普及到整个网络上还需要很长的时间。
不过,微软显然不仅下定了进军搜索市场的决心,还拥有极大的耐心,Live搜索官方博客上的声明也表达了相同的意思。微软首席执行官斯蒂夫·鲍尔默此前更是多次在公开场合反复重申,发展搜索引擎将会是微软的长期战略。
根据分析机构提供的数据,全球搜索广告市场的规模将在今年达到258亿美元,到2012年将增长到510亿美元。谷歌的每一个竞争对手都盯着这个市场,并在开发创新技术上投入了大量的财力和人力,以期在未来十年改变搜索市场目前的格局。在现金流方面能够和谷歌匹敌的微软如果成功地将Powerset整合到Live搜索引擎中,再通过浏览器捆绑策略,也许真的会取得意想不到的惊喜。
搜索引擎还处于发展期,有着极大的成长空间,这也让更多公司看到了复制或超越谷歌的希望。全球搜索广告市场的规模不断扩大,搜索技术将有可能决定最后的胜负,即使强大如谷歌,也不能保证会一直笑下去。而激烈的市场争夺战将有利于推动如语义搜索一样的新的搜索技术更快发展,用户也将会获得更好的搜索体验。(苗得雨)
观点:仅靠语义搜索很难击败谷歌
仅通过Powerset的一项语义搜索技术超越谷歌难度很大,因为它在识别视频和图片上并没有更好的解决办法,它目前只能扫描用户描述一段视频或者一张图片的单词,但不能对一段视频中的音轨或者图像进行分析,而谷歌在视频搜索领域的开发力度非常大。另外谷歌已经具有了相当多的忠诚用户,大量的用户也习惯了采用关键词方式搜索内容,因此,除非语义搜索得出的结果比谷歌引擎优秀,否则很难让这些忠诚的追随者变心。