对《提高连续识别效率》的补充
整机外设
看了第17期C5版的《提高连续识别效率》一文,笔者也想说说自己的经验,其实不管我们用什么OCR识别软件,都可以用下面的方法提高效率:
第一步
按照常规操作方法,扫描一页后用OCR软件进行识别,然后保存为一个文本文件。
第二步
假设保存目录为D:\doc,识别的文件有10页,最后分别生成为1.txt、2.txt、3.txt……10.txt共10个文本文件。
此时我们就可以利用DOS的COPY命令来快速进行文本合并。
进入D:\doc目录,新建一个文本文件,输入内容为:COPY 1.txt+2.txt+3.txt+4.txt+5.txt+6.txt+7.txt+8.txt+9.txt+10.txt 100.txt(注意:COPY后有一个空格,1.txt+2.txt+……+10.txt后有一个空格,表示合并后命名文件为100.txt),保存后把“新建 文本文档.txt”更名为“合并.bat”,然后双击运行(这样做的好处是避免在DOS和Windows之间进行切换),D:\doc下就自动生存了一个100.txt的文件,这就是合并后产文本文件。
第三步
把100.txt更名后另存到你指定的目录,然后把D:\doc目录里的“*.txt”文件全部删除,“合并.bat”要保留,以备下次使用。
提示:如果文件不是10页,我们又要重新改变“合并.bat”的内容吗?其实只须将平常扫描的最长文件页数在“合并.bat”里进行输入就行了,如我们平常扫描的文件最长为20页,将“合并.bat”文件内容改变为:COPY 1.txt+2.txt+……+20.txt 100.txt,保存后就可以了。以后文件不管是5页、10页或15页,直接运行“合并.bat”就行了。