程序员周记(5) 灌出第一桶水

站长空间

2007年4月28日 阴

目前论坛总共有 2 人在线。其中注册会员 1 人,游客 1 人。

我知道,那个整晚整晚在我们论坛上泡着的神秘游客是头儿,我跟踪过他的IP……

自从我限制了论坛广告机的注册和发帖,公司的论坛已经很多天没有新用户了。当然除了小林注册的“小林的马甲”、“小林的马甲的马甲”这些明显是马甲的马甲。我向头儿解释:没有注册用户表明公司立意高远、受众群稳重,是阳春白雪自然曲高和寡。头儿这次竟然有点怀疑我是在骗他(嗯,实际上我真的是在骗他)。

这种危急时刻自然少不了头儿逼我立下军令状这种千篇一律的情节,唉。

对于论坛或一般的网站来说,内容总是各种宣传推广手段的着力点,巧妇难为无米之炊嘛,所以当务之急就是积攒论坛的第一桶水。大面积原创我肯定没那水平,所以只能大面积转载了。可手工灌水速度太慢,加上有些文章内有图片Flash等,下载再上传到自己的论坛,这种折磨是我等以程序员自居的懒人所不能接受的。一切都要自动化,这才是目标。

论坛广告机可以模拟人的注册、发帖过程,那么同样的,我做一个程序来模拟进行文章的浏览过程,然后对文章内容自动整理转载不就行了吗?解决问题的思路有了,对应的技术是明摆着的(代码详见http://www.cpcw.com/web/f/f14.html)。

工作的步骤就是找准目标网站、建立采集页面的列表、取得页面内容、分析页面内容截取有用信息、发布到自己的论坛。就在我忙得不亦乐乎的时候,忽然发现了一个工具“火车头采集器”,思路竟然和我完全相同,真是不谋而合呀(好像他考虑的比我早那么一点点,周到一点点,实用一点点……)。

一晚上时间,论坛的四大板块、十六个分论坛被我灌进去了上万个图文并茂的精彩文章,我眼前闪现着网络那边,头儿看到论坛惊喜的表情;幻想着几天后,文章被搜索引擎收录带来巨大流量的情景……

后记:早晨,我一早就走进头儿的办公室,向他汇报工作进展,并真诚地说:“刘总,最近您也是整晚加班,在论坛上看我的工作进度,太辛苦了。”头儿愣了一下,说:“我只是上去随便看一下,然后就挂机下载电影了。”

我,我……