对《提高连续识别效率》的补充

整机外设

郑军 · 2004年5月17日

　　看了第17期C5版的《提高连续识别效率》一文，笔者也想说说自己的经验，其实不管我们用什么OCR识别软件，都可以用下面的方法提高效率：

　　第一步

　　按照常规操作方法，扫描一页后用OCR软件进行识别，然后保存为一个文本文件。

　　第二步

　　假设保存目录为D:\doc，识别的文件有10页，最后分别生成为1.txt、2.txt、3.txt……10.txt共10个文本文件。

　　此时我们就可以利用DOS的COPY命令来快速进行文本合并。

　　进入D:\doc目录，新建一个文本文件，输入内容为：COPY 1.txt+2.txt+3.txt+4.txt+5.txt+6.txt+7.txt+8.txt+9.txt+10.txt 100.txt(注意：COPY后有一个空格，1.txt+2.txt+……+10.txt后有一个空格，表示合并后命名文件为100.txt)，保存后把“新建文本文档.txt”更名为“合并.bat”，然后双击运行(这样做的好处是避免在DOS和Windows之间进行切换)，D:\doc下就自动生存了一个100.txt的文件，这就是合并后产文本文件。

　　第三步

　　把100.txt更名后另存到你指定的目录，然后把D:\doc目录里的“*.txt”文件全部删除，“合并.bat”要保留，以备下次使用。

　　提示：如果文件不是10页，我们又要重新改变“合并.bat”的内容吗？其实只须将平常扫描的最长文件页数在“合并.bat”里进行输入就行了，如我们平常扫描的文件最长为20页，将“合并.bat”文件内容改变为：COPY 1.txt+2.txt+……+20.txt 100.txt，保存后就可以了。以后文件不管是5页、10页或15页，直接运行“合并.bat”就行了。