把网上图书抓回家

软件强档

最近迷上在网上看书,可离开网络又无法观看,如果能把小说内容整理出来,放到手机或者PDA里面随时随地的看那多方便。我找到一款小巧的极为方便的图书抓取软件——MagicGet,它可以快速自动抓取、整理、转化新浪、搜狐、晋江文学频道的图书,可自动分析目录并下载整本图书保存为TXT文件。

PCW工具箱

软件名称:MagicGet

最新版本:0.25

软件大小:80KB

下载地址:http://www.newhua.com/cfan/200519/magicget024.zip

工作原理:

很多网站的图书目录都是链接,点入后,就可观看相应的章节。对于这样的结构,如果用手工方法或者用网文快捕等都比较麻烦,但用MagicGet 就非常方便。它的原理如下:

1.按照给定的URI,从Internet得到网页

2.从网页解析出链接

3.从链接解析子页面

4.保留子页面指定内容

操作实例

MagicGet的操作界面很简单,一目了然。下面以下载新浪读书频道的小说《羊肉炉不是故意的》为例,实战便捷的抓书过程。

1.运行MagicGet(由于软件作者没有提供0.25版下载地址,暂且先使用0.24版吧),选择“新浪读书”标签,在地址栏中输入小说《羊肉炉不是故意的》的目录地址http://book.sina.com.cn/nzt/1102928184_yangroulu/index.shtml。

2.点击右边的“列出目录”按钮,程序立刻分析并例出本书目录,并在“结果”栏中出现抓取的标题及目录。

3.在小说标题的右侧,选择需要抓取的章节(默认为小说全部内容),并点击“抓取内容”按钮即可。完成后,所抓取的内容就会显示在“结果”栏中目录的下面。(见图1)

45-g5-6.jpg
图1

4.点击“清理”,可去掉所抓取内容中各章节名字两侧的“/”和“*”;点击“复制”,可将“结果”栏中所有内容拷贝到剪贴板中;点击“保存”,可以自动生成TXT文件,保存在软件目录中。(见图2)

45-g5-7.jpg
图2

提示:如果章节过多,需要比较长的时间,软件处于假死状态。这时可以不必理会,去做别的事情吧。抓取完成后,软件会出现提示的。

如果大家在使用中出现错误图3的提示,主要原因可能有三个:

45-g5-8.jpg
图3

1.你没有安装.net框架

2.你IE使用了代理服务器

3.网站更改了页面

对这样的问题你只需要对浏览器做相应的修改就可以了。