搜索出来的世界——搜索引擎发展之路
综合报道
如今,互联网上的第一大应用是什么?或许有人还会坚持认为是电子邮件,或许有人认为是即时通讯,但更多人可能会选择搜索引擎。确实,当面对网络上浩瀚的知识海洋时,我们需要一名领航者,搜索引擎无疑在扮演着这样的角色。今天,我们就来了解一下搜索引擎的历史,可以发现──“世界”就是这样被一点点搜索出来的……
培育期
从1946年人类发明计算机,一直到20世纪90年代,计算机网络才比较完善。在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。可见,搜索引擎出现的历史并不算长。
说到现代意义上的搜索引擎的祖先,是1990年由加拿大的麦吉尔大学学生阿兰发明的Archie,当时互联网还未真正出现。Archie是第一个自动索引匿名FTP网站文件的程序,但它还不是真正的搜索引擎:用户必须输入精确的文件名搜索,然后Archie才会告诉用户哪一个FTP地址可以下载该文件。
在当时,“机器人”一词在编程者中十分流行。所谓的电脑“机器人”是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序像蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序也被称为“蜘蛛”程序。世界上第一个用于监测互联网发展规模的“机器人”程序是World Wide Web Wanderer。刚开始它只是用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。
但是,随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理做了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以JumpStation最负盛名。但是,以当时的网络应用环境来说,搜索引擎还没有得到广泛的应用。
发展期
最早现代意义上的搜索引擎出现于1994年。当时迈克尔·马丁将李维特的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。1994年7月20日, Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其他搜索引擎的数据量。同年4月,斯坦福大学的两名博士生菲尔罗和美籍华人杨致远共同创办了超级目录索引Yahoo。
1995年,一种新的搜索引擎形式出现──元搜索引擎。用户在使用的时候只需要提交一次搜索请求,然后由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。元搜索引擎概念说起来好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。
而在今天大红大紫的Google,在1998年10月之前还只是斯坦福大学的一个BachRub小项目。1995年博士生拉里开始学习搜索引擎设计,于1997年9月15日注册了google.com的域名,1997年底,在司布林和哈桑的共同参与下,BachRub开始提供测试版。1999年2月,Google完成了从Alpha版到Beta版的蜕变。于是,Google公司则把1998年9月27日定为自己的生日。Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票、词典寻找等功能上的革新,再一次永远改变了搜索引擎的定义。
在2000年以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其他搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。直到2000年数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。
技术领先化
自从搜索引擎这座金矿被Google发掘出来以后,这个市场就从来没有平静过。在国际市场,Google、微软、雅虎等巨头纷争不息。如何在竞争日趋激烈的搜索引擎的市场中找到属于自己的奶酪呢?
显然,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。其实,搜索引擎不管终端用户是面向哪个层面,技术仍是其发展的决定要素。Google的成功就是一个例子。Google取得成功的最重要因素之一,就是技术领先带来的能够明显超越竞争对手的巨大优势。在Google创立之初,创始人就认定了技术是成功的关键,并开发出了高效搜索算法,在极短时间内就赢得了大量用户的青睐。Google的经验告诉人们,作为搜索引擎,技术领先是取得成功的一个不容忽视的因素。不论是哪一种搜索引擎,只有能够保持技术领先的优势,为用户提供更为准确可靠的信息,才有机会赢得更大的生存空间。
结 语
搜索引擎技术目前还和用户的某些期望相去甚远:它并不能智能化理解人类的想法,且未与人类的生活完全结合。也许,未来人们将可以不通过计算机的输入而仅仅通过语言便更为快捷地获得信息。到那时,信息资源的传播和共享速度将达到前所未有的境界。