用好搜索引擎

Author: 周建军 Date: 2000年 第17期

  搜索引擎(Searching Engine)使用某些软件程序(如Robots、Spiders或Crawlers)把Internet上的所有信息归类或者人为地把某些数据归入某类别,形成一个可供查询的大型数据库。善于使用搜索引擎能够帮助我们从浩瀚的网络海洋中快速找到所需的信息。
  搜索引擎一般都提供两种查询方式:一种是关键字索引查询,另一种是分类细化逐步接近查询。在这里我们以雅虎中国为例详细介绍一下使用搜索引擎的技巧。
#1  一、关键字索引查询
  首先,我们来到雅虎中国 (http://cn.yahoo.com)的站点(如^17040310a^所示),可以看到页面上有一个可以键入关键字的输入框和一个名为“搜寻”的按钮。我们可以在输入框中键入关键字,然后按“搜寻”按钮进行查找。键入关键字后,查寻向导自动把关键字与整个Web资源索引进行比较后给出查寻结果。如果已经找到一些有用的东西,这种带超级链路的摘要可以让你进入实际的网站。
  使用关键字索引的关键是关键字的选定——如果关键字选择得不当,搜索的结果会多得令你难以想象;如果关键字选择得恰到好处的话,也可能会一发命中。所以,我们在选择关键字时,要尽量利用完整的句子或者使用合适的运算方式来减少搜索范围。另外,当我们查询资料的关键字多于一个时,应该按关键字的重要性次序输入搜索引擎,这时搜索引擎会以第一个关键字作为查找信息的根据,然后将符合条件的内容再作为第二个关键字的搜索范围,符合第二个关键字的内容再作为下一个关键字的搜索范围,这样查找的结果多数是令人满意的。
  上面我们说过可以使用关键字运算方式减少搜索范围,下面我们就将常用的逻辑运算符简要介绍一下。
  1.+:也就是逻辑与,用加号把两个关键字连成一对时,只有同时满足这两个关键字的匹配才有效,而只满足其中一项的将被排除。比如我们键入“电脑+计算”,则在查询“电脑”的结果中将不包含“计算”的结果排除。
  2.-:也就是逻辑非,如果两个关键字之间用减号连接,那么其含意为包含第一个关键字但结果中不能含有第二个关键字。例如我们键入“电脑-计算”,则在查询“电脑”的结果中将包含“计算”的排除。
  3.():当两个关键字用另外一种操作符连在一起,而又想把他们列为一组,就可以对这两个词加上圆括号。比如我们可以键入“(电脑-计算)+(程序设计)”来搜索包含“电脑”、不包含“计算”但同时包含“程序设计”的网站。
  4.*:星号可代替所有的的数字及字母,用来检索那些变形的拼写词或不能确定的一个关键字。比如键入“电*”后查询结果可以包含电脑、电影、电视等内容。
  5.“”:用双引号括起来的词表示要精确匹配,不包括演变形式。比如我们键入带引号的“电脑报”,则“电脑商情报”等信息就不会在结果中出现。
  6.“t:”和“u:”在关键字前加上t:,搜寻引擎仅会查询网站名称,而在关键字前加u:,则搜寻引擎仅会查询网址 (URL)。
    比如说,我们想查询“电脑报”网站,如果键入关键字“电脑报”(不加双引号),则搜索结果会包括电脑报、电脑报价等很多与之相关的网站;如果关键字为加引号的“电脑报”,则相应的结果会少许多,而我们如果键入的关键字为“t:电脑报”,那查询结果就非常清楚了。
  只要我们充分利用这些运算符号,相信搜索的结果一定会让我们满意的。
#1  二、分步细化逐步接近查询
  如果我们想查找某一类信息但又找不到合适的关键字时,就可以使用分类式搜索逐步深化,这样得到的结果也是令人满意的。
  我们可以看到,雅虎中国的主页上已经将所有的信息分为休闲与运动、社会科学、社会与文化、新闻与媒体、电脑与因特网等十四类,然后再根据各个大类再分为各个小类别,如在“电脑与因特网”中又细分为“因特网、谈天室、软件”。如果你细心一点的话,不难发现各个类别中所显示的小类别并不完整。这是由于目前网络上的类别实在是非常多样化,要在一个屏幕里面将所有的类别一次列在你的面前确实有相当大的困难。这并不要紧——你只要在“电脑与因特网”下单击鼠标进入该类别,那么系统就会很快地将所有的细分内容一一呈现在你的面前。比如说,我们想通过这种方法找到“电脑报”的网址,就可以首先按一下“电脑与因特网”,紧接着出来的页面上会提示“电脑与因特网”一类中含有“安全与加密”、“新闻与媒体”、“电子通讯”、“多媒体”等一系列信息,我们按下“新闻与媒体”查询后结果仅有“报纸”和“杂志”两项,我们再按下“报纸”,“电脑报”就找到了。
  网络上常见的搜索引擎大都提供这两种方法,但有些网站在关键字的逻辑运算符号与雅虎中国不同,他们把“逻辑与”写作“AND”,把“逻辑非”写作“NOT”,但只要我们多试几次,也就能很快掌握了。总之,漫无目的的上网不是一个好习惯,我们应该养成利用搜索引擎快速查询信息的习惯。