另眼看搜索引擎

网络与通信

搜索引擎对于网络就好比地图对于交通,电话簿对于通讯。要想建立一个高效、有序的网络世界,我们必须有足够精良的搜索引擎。
每个人上网都有自己具体的需求,搜索引擎正是满足这种需求的最好工具,输入自己想了解的关键字词,就能得到相符的网站网页信息。不能否认现有的搜索引擎极大地方便了我们的网上生活,但我想大部分网民也像我一样对它存在着不满。

一、内容与价值

搜索引擎是一个数据库,其容量是决定其使用价值的一个重要因素。
某次为找一张古龙的照片作为书的插图,那好,快去搜吧!大概所有的网站都怕侵犯古大侠的肖像权。偌大的网络能搜到的只有关于古龙作品和古龙群侠传的消息,照片只有一张,而且小得没法用,那是一个网站用作人物介绍的。
古龙迷们不要急着追问到底网上有没有,要是真的没有的话我也不能怪搜索引擎不灵了,最后当然让我找到了,不过却不是通过搜索引擎。
建议:能不能给非文字资料建立一些类别,比如图片、动画……以免图文并茂的互联网在搜索引擎面前变成了文字网!

二、更新与淘汰

光有内容是不够的,更新也是评价网站的一个重要标准,有时候更新甚至比原来面目更重要。
要更新当然也要淘汰,可是眼下的搜索引擎就是这样一个只吃不拉的怪物。那些搜索结果中几乎有一半以上是过期、作废的链接,你点一下,让你等上半天后告诉你“找不到网页”。现在外面什么排毒养颜的东西那么多,网站的工作人员如果真的没办法清理那些过期无效的东西,何不去花两个小钱去买来试试?
建议:除了尽快更新数据库以外,能否让搜索引擎检查链接的连接成功率?

三、真实的谎言

网站出些虚假新闻哗众取宠也不是什么新鲜事了,新鲜的是搜索引擎跟你开玩笑。
一次搜索宁波A公司,有一条消息赫然写着某产品抽查近一半不合格,内容简介中有该公司和其他厂家的名字。点进去一看,实在是让人哭笑不得,标题是某产品抽查近一半不合格,文章开头列了不合格产品的型号生产厂家,结尾又加了句“合格的有A公司”等等。原来搜索结果中的简介断章取义,只取头取尾,并且各取半句,就留下了一句陷害忠良的简介。
这只不过是搜索引擎给我们调皮捣蛋的一种,其他的情况诸如把前后句,上下文毫不相干的字拼在一起,变成符合要求的关键词;搜索结果与链接网页内容不符;搜索结果重复等情况也是屡见不鲜。
建议:搜索引擎是不是也该开发点什么“人工智能技术”?

四、间接的陷阱

有人会说陷阱还分什么直接和间接,反正都是引人受骗上当的。我要强调像新浪、搜狐、网易等大型网站它们自身的内容包括搜索引擎本身是不可能出问题的,但是它们的搜索结果中的网站上就不能保证没有不良信息了。
另外一个重大的危险就是病毒,现在已经有了带病毒的网页脚本,用户一浏览就会中毒的。同上面一样搜索引擎可以保证自己无毒安全,但却不能保证那些链接指向的站点安全。我们不能把所有责任往搜索引擎上推,但既然你给了我网站地址,你总要为我的安全提供一些保证。因此,搜索引擎不能简单地把某些网站信息收录其中就万事大吉,它也应该监督那些网站,或者干脆屏蔽掉这些不安全的连接,保证用户利益。
建议:在自动收入数据库时,同时检验网页数据,尽量做到排除“网页毒素”。

用户的“奢求”

评价一个搜索引擎好坏并不止内容、更新、正确、安全等要素,还包括速度、操作,界面等。我个人认为从程序本身角度或者技术角度出发,这些方面是搜索引擎可以或者说应该改进的地方。时下网站挖空心思来提高浏览量,为何不在搜索引擎上下点工夫,面向一些比较专业的,有特定商业或者学术用途的用户,开发一个百搜百中的引擎。这样不光能提高点击量,同时,这些用户往往经济基础也比较好,当他们真正从中受益后,网站要收费他们也会乐意付钱!