Blinkx:传统搜索终结者?

聚焦

新年伊始,搜索列强拼争搜索市场,摆开了决战“桌面”的阵势。其中,除了Google、微软和Yahoo!之外,还有一个非常值得我们关注的尚在襁褓中的“虎子”Blinkx,也发出了咄咄逼人的吼声。无疑,2005年的搜索市场龙争虎斗必然充满腥风血雨,演出一幕幕波澜壮阔的好戏。

2005年元旦刚过,即有消息传来:布林克斯公司(Blinkx)新炮制的一个Blinkx搜索引擎中文测试版已经“竣工”,不久将进入中国市场。有媒体把这种搜索方式称为“占卜式”搜索,或称其为“会思考”的搜索引擎。它的新颖性能令网友惊喜不已,也让传统搜索巨头们为之瞩目。

Blinkx的技术优势

与传统搜索引擎不同,Blinkx“会思考”,搜索结果会出现多类。比如“Mobile Gaming”,出现的结果可能被系统自动分为10类,其中的9类可能与用户的查询期望距离较大,用户可将最接近的那个结果作为查询条件,进行第二次查询,通过这种方式逐步接近目标,最后达到用户期望查询的结果。

传统搜索基本上采用“关键词”搜索方式,也就是“非0即1”的方式,它基于严格定义和分类的布尔表达式,即“与、或、非”表达式。在实际应用中,如果关键词不确定,或者有错误疏漏,用户常常很难用具体而明确的关键词来描述自己想找的东西,甚至在有些时候,搜索出来的结果大部分与这个关键词并没有太大关系,只是搜索的结果文章中出现过这个词而已。

目前,人类研究的信息搜索技术目前有四个方向,即关键词搜索、模式识别、语义分析、神经网络。其中,关键词搜索已经比较成熟,语义分析和神经网络这两个技术方向的研究难度相对较大,目前还未有突破性的研究成果。

在保留了传统搜索方法(search)的基础上,Blinkx会对用户键入的检索内容进行语义上的分析,通过判别相关识别度的高低来对数据进行检索,然后对海量信息进行概念匹配,找出在内容上最接近的数据提供给用户,所以可以避免传统“关键词检索”造成的漏检情况的发生。

Blinkx中提供的“聚类”功能则是“从搜索到发现”的最佳表现。它不仅可搜索互联网内容,电影电视等多媒体内容,还可以搜索本机和局域网上的内容。同时,Blinkx还可以搜索不同的文本格式内容,如Text、Word、Excel、PPT、PDF以及各种数据库中的数据格式。与Yahoo! Video Search比起来,Blinkx的视频音频搜索(http://www.blinkx.tv/)更加强劲,它使用了语音识别技术来检索多媒体文件。也就是说,可以搜索任何一个在视频或者音频文件中曾经提及的单词。

如果客户端安装了Blinkx软件,系统所有文档处理窗口的右上方就会出现一个小的菜单窗口。用户在这些窗口中处理文档时,系统会自动分析这个文档,然后自动从本机或网络上抓取相关文章或链接,以供用户参考。不仅如此,它还可以及时提供与文章内容相关的新闻、产品信息、视频内容等分类信息。简单地说,用户完全可以拿一篇文章来作为“查询关键词”,Blinkx通过对这篇文章进行分析,会给出与这篇文章内容最接近的网络链接或本机文档。这无疑给需要处理大量数据的个人和企业提供了巨大便利。

传统搜索门派的终结者

布林克斯是一家私营搜索服务公司,总部位于伦敦和旧金山两地,该公司的联合创始人之一凯西在一份新闻稿中表示,当开发Blinkx时,我们知道用户真正需要的是直奔目标,他们对搜索引擎的复杂性不感兴趣。

尽管Blinkx发布才短短几个月的时间,但Blinkx的名气却并不小。北京时间2004年11月1日,布林克斯公司宣布,该公司已聘请雅虎欧洲前负责人马克·伍普祖默(Mark Opzoomer)为公司新任首席执行官,从Blinkx目前的蔓延态势看,它很可能成为几大传统搜索门派的终结者。

随着Blinkx加入,并直接挑战Google等巨头,新兴搜索市场变得越来越热闹了。但目前Blinkx美中不足的是仅支持英德两种语言,而且都只是测试版,其数据库中装载的信息还不够完善,更新频度也不够快。同时Blinkx在中国境内还没设立服务器,浏览网页的速度会受到较大影响。