把网上图书抓回家
软件强档
最近迷上在网上看书,可离开网络又无法观看,如果能把小说内容整理出来,放到手机或者PDA里面随时随地的看那多方便。我找到一款小巧的极为方便的图书抓取软件——MagicGet,它可以快速自动抓取、整理、转化新浪、搜狐、晋江文学频道的图书,可自动分析目录并下载整本图书保存为TXT文件。
PCW工具箱
软件名称:MagicGet
最新版本:0.25
软件大小:80KB
下载地址:http://www.newhua.com/cfan/200519/magicget024.zip
工作原理:
很多网站的图书目录都是链接,点入后,就可观看相应的章节。对于这样的结构,如果用手工方法或者用网文快捕等都比较麻烦,但用MagicGet 就非常方便。它的原理如下:
1.按照给定的URI,从Internet得到网页
2.从网页解析出链接
3.从链接解析子页面
4.保留子页面指定内容
操作实例
MagicGet的操作界面很简单,一目了然。下面以下载新浪读书频道的小说《羊肉炉不是故意的》为例,实战便捷的抓书过程。
1.运行MagicGet(由于软件作者没有提供0.25版下载地址,暂且先使用0.24版吧),选择“新浪读书”标签,在地址栏中输入小说《羊肉炉不是故意的》的目录地址http://book.sina.com.cn/nzt/1102928184_yangroulu/index.shtml。
2.点击右边的“列出目录”按钮,程序立刻分析并例出本书目录,并在“结果”栏中出现抓取的标题及目录。
3.在小说标题的右侧,选择需要抓取的章节(默认为小说全部内容),并点击“抓取内容”按钮即可。完成后,所抓取的内容就会显示在“结果”栏中目录的下面。(见图1)

4.点击“清理”,可去掉所抓取内容中各章节名字两侧的“/”和“*”;点击“复制”,可将“结果”栏中所有内容拷贝到剪贴板中;点击“保存”,可以自动生成TXT文件,保存在软件目录中。(见图2)

提示:如果章节过多,需要比较长的时间,软件处于假死状态。这时可以不必理会,去做别的事情吧。抓取完成后,软件会出现提示的。
如果大家在使用中出现错误图3的提示,主要原因可能有三个:

1.你没有安装.net框架
2.你IE使用了代理服务器
3.网站更改了页面
对这样的问题你只需要对浏览器做相应的修改就可以了。