搜索引擎的四大地雷

特别策划

9月19日,百度MP3官司败诉。

这场官司的结果在业界引发剧烈震荡,同时也表明了这样一个事实:日益壮大的搜索引擎上存在危险的“地雷阵”:非法版权的数字内容、色情信息、个人隐私、国家机密就如同4个威力巨大的“地雷”,如果不及时排除,不仅会对每一个触雷的网民造成伤害,还可能将正在茁壮成长的搜索引擎炸得粉身碎骨,甚至毁掉中国互联网!

子母雷

非法版权数字内容

子母雷特点:包括MP3音乐、电子书、电影等“子雷”,都是没有获得版权授权的数字内容。

CNNIC的报告指出“有超过45%的网民每天使用互联网下载音乐、超过37%的网民经常使用互联网下载影视”。而另据统计,目前中国共有7200家音乐下载网站,但仅有10%左右的网站获得了唱片公司的授权或者缴纳版税。

触雷案例:近日,兰登书屋、美国大学出版协会、John Wi-ley & Sons等800多家出版公司和个人集体控告Google,指责对方的数字图书馆计划。

这个计划要将全球最著名的大学公共图书馆的图书数字化,要把4000多万册最优秀的图书放到网上,供所有的用户使用。

美国大学出版协会会长比德·吉尔佛致电 Google,批评这项计划显然是“有系统的大规模侵害版权”的做法。

观点:搜索引擎必须尊重版权

搜索引擎有自己的理由:没有去复制和发布任何产品,只是通过一个探索程序找到了一个网址并把这个网址传递给了搜索者而已。对搜索引擎提起诉讼无异于指控一个报纸派送员,并说他应该为他所送的报纸中存在的版权问题负责。

但是,如果信息搭上了搜索引擎门户的顺风车,传播速度会提高达6个数量级,作为主要的检索技术的提供者,搜索引擎必须为知识产权受到的侵犯负应有的责任,至少和制造侵权内容提供商等同。

核地雷

色情信息

核地雷特点:它放出来的有害元素不仅对肉体造成伤害,还会严重地伤害到网民的心理健康,造成严重的“色情辐射”。

如今,为提高点击率以符合某些指标,一些有名的搜索引擎开始打色情内容的擦边球。

在百度中以“妹妹”作为关键词搜索,在页面最下方的“相关搜索”里出现了“漂亮妹妹”、“水仙妹妹”、“性感妹妹”等。如果点击“性感妹妹”,出现的链接就“别有洞天”了。诸如“性感妹妹激情艳舞视频”,“妹妹你的衣服”等等。

更为严重的问题来自基于点对点技术的搜索引擎,它们把搜索的范围从公开发布的互联网延伸到了每一个用户的硬盘上。每天通过这种形式进行的色情信息交换量,据保守估计超过10TB。

触雷案例:2005年8月,美国儿童保护组织公开指责全球最大搜索引擎Google推出的视频上传服务,因为大部分上传内容都带有严重色情成分。该搜索引擎创始人之一Larry Page表示,他们公司要人们把自己在家里做的视频上传,不管其内容中的色情成分有多大。

实际上Google从2004年下半年就开始提供TV秀的搜索服务,可用字或词匹配的方式寻找视频链接,其中有大量的让人目瞪口呆的色情表演。

观点:色情泛滥,搜索引擎难逃其咎

如果说版权的问题由于内容复杂,并且表现形式多样而难以控制,搜索引擎还能够说自己由于关键词分划存在技术障碍作为借口的话,那么在色情和其它不良信息控制上搜索引擎就难逃其咎了。

早在2002年,有关部门就建立了庞大而完善的反色情过滤词表。而任何一个想主动采用动态分词和带有反色情模块的智能探索程序的搜索引擎都没有理由大批量地返回与色情相关的搜索结果。

反探索过滤技术的应用主要来自于利益驱动。要知道色情信息每天为搜索引擎带来的流量可达上百万,这是一笔很容易就能算清楚的账。流量对于网站而言,直接意味着利润,对于专业搜索引擎来说,每天能增加上百万流量,也就意味着能在很多方面增加经济利润。据说一旦去掉色情信息,搜索引擎的日流量至少会减少50%。

反步兵雷

个人隐私

反步兵雷特点:针对个人,能够在最短时间内让一个人赤裸裸地曝光于上千万甚至上亿网民面前,直至彻底毁掉一个人。

今天,以Google为代表的搜索引擎正在收集诱人的个人隐私信息,而这些搜索引擎对这些信息是否保密却并不在乎。

在可能侵犯隐私方面,Google是最具代表性的。这家公司能够拥有很多关于用户上网习惯的个人信息,包括电子邮件、保存的搜索历史、图片,来自社会性网络站点 Orkut的私人信息。比如,Gmail需要用户与电子邮件地址。通过比较发现,雅虎的注册还要求用户提供地址、电话号码、生日、性别、职业,一些金融服务还需要用户提供家庭住址、社会保险号码等。

美国电子隐私信息中心的克里斯·胡夫纳格尔指出:“由于承载了太多的个人信息,搜索引擎正在成为互联网上最大的个人隐私安全隐患之一。”甚至有业内人士表示,搜索引擎为私人信息泄漏提供了便利的途径,这个现象不会在短时间内消失。

触雷案例:让美国Boston某中学老师Michael始料不及的是,当年几本不起眼的、讲述了自己少年时代的放荡和堕落以及17岁被关进监狱等故事的书会在10多年后给他带来麻烦。不知书中的内容是何时被好事者放到了Internet上,又如何被Google编录的。两年前,他的一位同事上网时偶然在Google中敲入了Michael的名字,Michael狂野不羁的过去出现在屏幕上。不久,Michael丢掉了工作,理由是他的个人背景不适合为人师表。

观点:搜索引擎无权“剥光”公民

作为一个搜索引擎,应该从一开始就非常关注用户的个人隐私问题,而不只是事后来解决,尤其是在一项新服务推出时。

搜索引擎正在逼近一个十字路口,一个决定其未来方向的十字路口。过去微软因为搜集公民隐私遭到痛斥,这是一个教训。决定个人信息是否应该被公布于众的一定是公民自己,而不是任何一家公司。

反坦克雷

国家机密

反坦克雷特点:杀伤力更大,一旦出现严重的国家机密泄漏,有可能直接摧毁搜索引擎本身。

随着Google等众多搜索引擎推出各自的全球地图服务项目,涉及泄露国家军事机密的现象越来越有可能。

很多国家和地区的政府部门都抱怨这些卫星地图服务将敏感地区彻底暴露在网民面前,如果被别有用心的人利用,对国家安全将造成难以预料的危害。

触雷案例:9月18日,英国国防专家发出警告称,恐怖分子正在利用免费的网络太空照片,而这些照片泄漏了敏感的英国军事设施 。

这个警告是针对Google推出“Google Earth”服务而发出的,在“Google Earth”上保存了大量世界各地的卫星照片,包括英国政府通信总部、克莱德的法斯莱恩核潜艇基地。

观点:搜索引擎,小心自己被“炸掉”

相对前面三种“地雷”,泄露国家机密这颗“超级地雷”更有可能让搜索引擎本身被炸掉,因为在任何国家,危害国家安全的行为都将遭到严厉惩罚,所以在没有出事之前,以Google为代表的搜索引擎应该好好想想如何尽快将这些涉嫌危害国家安全的内容从上面去掉。