E-mail地址搜集方法三则

Author: 张佳昺 Date: 2000年 第7期

  有这么一群人,他们将网络上分散的网站搜集整理,建立了一个搜索导航引擎。他们中的很多人都成了富翁,甚至亿万级的富翁。
  有这么一群人,他们将网络上流传的E-mail地址搜集整理,建立了一个E-mail数据库。他们成了网民们的公敌,深恶痛绝的那种公敌。
  同样是搜集Internet上的资源,同样是为网民服务,那些搜索E-mail地址的人却背上了骂名,仅仅因为他们是垃圾邮件发送者的帮凶。不可否认,大量的垃圾邮件的确浪费了我们大量的上网时间和精力,但另一方面也给我们带来了不少有用的信息。而对于许多网虫来说,为了使自己的网站、软件尽快为人所知,发送垃圾信也是无法避免的。不过,目前国内从事E-mail搜集工作的人的确存在着良莠不齐的现象,特别是相当多的人利用出售搜集到的E-mail以牟取暴利。许多普通的网民由于不了解E-mail的搜集技术,而不得不受制于那些E-mail地址的出售者。
  笔者出于兴趣,曾经花过一段时间研究E-mail的搜集技术。在这里,将研究的结果公布于众,使这门技术不再为少数人所垄断。因为E-mail搜集技术很多,技术难度也不一致,笔者仅介绍一般常用的三种搜集方法。
  1.勤劳致富法:本方法适合于那些刚刚上网,只会使用浏览器的初级网民。对于刚刚学会上网,对网络的认识还仅仅停留在浏览器阶段的那些菜鸟来说,唯一切实可行的搜集E-mail地址的方法就是人工手动搜集了,也就是使用浏览器,一个一个地访问别人的主页,然后从主页中诸如“与我联系”、“给我发信”等链接处获得别人的E-mail地址,最后将这些地址整理保存起来。这个方法的效率无疑是极其低下的,即使是像笔者这样的老手使用这种方法一个小时也只能搜集100~150个E-mail地址。不过,千万不要因为这种方法的效率低便忽视它,凡事有弊必有利,虽然人工收集效率低,但是准确性、针对性强。特别是在我们要搜集特定群体(比如说使用VB的程序员)的E-mail地址的时候,这是唯一真正可行的方法。笔者相信:E-mail地址的搜集技术总有一天会由目前的注重数量向注重质量和注重准确性过渡,所以熟练掌握这种技术,无论对于哪一个技术层次来说都是十分必要的。
  2.向外拓展法:此法适合于那些能够熟练使用除浏览器外其它网络工具的中级网民。就原理而言,实际上与前一种方法没有什么区别,不过是利用特定的应用程序来加快速度、提高效率。本方法需要特定的软件——E-mail地址分离软件的配合,这种软件的作用便是从剪贴板、特定的HTML文件处获得HTML源代码,然后从源代码中分离出E-mail地址来。也就是说,在勤劳致富法中需要我们手工搜集的工作现在由软件代替了。这种软件可供选择的不少,笔者推荐大家使用的是名为“E-mail地址捕捉器(下载地址:http:∥www4.netease.com/~herald)”的软件(^07040305a^1)。据笔者所知,这是目前网上最早出现的也是功能最强大的中文E-mail地址分离软件。有了这个软件,我们所要做的只是:将HTML文件拷贝到剪贴板或直接拖曳到“E-mail地址捕捉器”,剩下的工作便全部由软件完成了。这个软件特别适合于那些一个文件中包含大量E-mail地址的文件,效率可以得到几十几百倍的提高。那么,包含大量E-mail地址的HTML文件又从那里获得呢?根据笔者的经验,以下几类网站包含大量这样的文件:在一些比较热门的商业网站或个人主页的留言本中;一些热门的BBS;在一些专门提供网友通讯录的地方(比如说交友站、拍卖站、婚姻介绍站、职业介绍站)。
  3.自力更生法:方法2介绍的是从网络上的文件中分离E-mail地址。其实,我们的硬盘也是一个大宝库,浏览器缓存、软件的说明文件、有作者联系地址的小说文章中都包含着E-mail地址,所以笔者在这里要向读者再推荐另一种类型的E-mail分离软件,这种软件的工作原理是搜索硬盘上的所有文件,从这些文件中分离出E-mail地址来。此类软件笔者推荐大家使用“CK电子邮件查找工具(下载地址:http:∥www.top169.net/home/clansoft)”(^07040305b^2),读者只要设置好输出文件、数据源点(建议读者依次设定为C:\、D:\、E:\……),它便会自动从硬盘中搜寻。笔者曾经在自己的10G硬盘中一下子搜索出1500多个E-mail地址,拥有大硬盘的读者一定要试一下。
  最后给大家一个忠告:千万不要利用搜集到的E-mail地址来发送垃圾邮件。