正确使用惠普扫描仪的TH-OCR识别软件

Author: 曹彦 Date: 2000年 第21期

  五一节放假前买了一台扫描仪,准备放假期间学一点关于扫描仪的操作和文字识别知识,为以后办公应用作准备。
  扫描仪的型号是Hp scanjet 5200c,随机带有三张配套光盘,一张是简体汉字光盘,另一张是英文驱动程序光盘,还有一张光盘装有清华文通公司的随机捆绑识别软件:TH-OCR Ver7.00 For HP。按照说明,先安装扫描仪驱动程序,再安装随机带的清华文通TH-OCR软件,安装以后,扫描仪工作正常,但进入TH-OCR软件,按照其说明文件的要求设置以后,无法使用“扫描”和“识别”功能。主要有以下两个问题:
  1.无论在“文件”菜单还是在工具栏,点击“扫描”后,屏幕上出现:“打开扫描仪驱动器HPSCAN错误”。
  2.用扫描仪扫描出*.tif(未压缩)图像文件,将其在TH-OCR中识别,在进入识别程序后,打开扫描图像文件(*.tif),在屏幕上出现一页文章从某一位置被分开,并且左右颠倒,比如文章从中间分开,每一行右边的结尾部分放在了这一行的左边开头部分(但是这些文件如果用ACDSee 32打开,则完全正常)。这样TH-OCR根本无法识别,就是勉强能识别,也是一团乱七八糟的文字,根本无法正确辨认和编辑。
  经过分析,其主程序Winocr.exe的最后修改日期是1997年12月22日,文件大小为169K,其readme说明文件是1997年10月写的。该TH-OCR识别软件由于推出的时间较早,可能与新型的HP扫描仪的驱动程序兼容性不好。向经销商咨询,说没有碰到过这样的问题,无法给出解决方案。突然想到了互联网络,于是首先登录联接到了惠普的扫描仪站点,但是其上根本没有关于扫描仪文字识别软件(TH-OCR)的任何文字说明,看来这个网站是不能解决问题了。而清华文通的软件包装上又没有其网站信息,好在他们还标出了其公司的名称,通过搜索,找到了清华文通的网站(http://www.wintone.com),清华文通公司已经发现了这个问题,在网站上贴了一个补丁程序,赶紧下载,将其拷贝到原TH-OCR的安装目录中,把原有的Winocr.exe覆盖掉。重新打开TH-OCR,设置、扫描、识别、编辑,OK!
  能识别、编辑了,总算松了一口气。但是随之新的问题又出现了,在扫描了一页进行识别、编辑、存盘以后,再次进入“扫描”,可以进行扫描工作,但是一进入识别程序,屏幕出现以下对话框:“该程序执行了非法操作,即将关闭,如果仍有问题请与程序提供商联系。”点击“详细资料”,出现以下文字:“Winocr在0005:00007ae6的模块Winocr.exe中导致常规保护错误。”下面是一大堆寄存器地址之类的信息,点选“关闭”退出TH-OCR识别程序,无蓝屏和死机现象发生,再次进入TH-OCR,还是只能扫描和识别一页。
  总不能每扫描一页就退出一次,这哪叫工作,简直是浪费时间。可是问题总得解决,经过多次的试验终于可以在不用反复退出TH-OCR程序就可以连续扫描、识别了。解决的方法如下:
  1.扫描识别一页后点选“存盘”,可以将识别的*.txt文件存入默认或者你需要的目录。
  2.打开“文件”菜单,选“关闭所有文件”,出现“关闭所有文件……画面”后,将“删除跟踪文件”和“删除图像文件”前面的复选方框选中,点击右上角的“确认”按钮,此时屏幕又回到“TH-OCR For HP-untitled”的开始画面。
  3.点击工具栏上的“编辑”(钢笔图形标记)或者“命令”菜单下的“编辑”命令,使屏幕进入扫描预备状态。
  4.点击“图像”菜单,选择“删除区域”,再次打开“图像”菜单,选择“删除所有区域”,点击选中该命令。
  5.重新进入“文件”菜单,选择“扫描”,然后点击确定,即可进行下一页的扫描和识别。
  以后的扫描和识别,重复上述的几个步骤即可。