对《巧妙消除水印对文字识别的影响》一文的补充
整机外设
看了第21期《电脑报》的《巧妙消除水印对文字识别的影响》一文后,笔者不禁喜出望外,因为笔者前两天正好接到领导交代的任务,要将一本产品说明书做成电子文档以方便编辑。烦人的是这本说明书每一页都有以厂家的名称做成的彩色水印,在选取识别区域的时候根本避不开,所以识别后的效果简直是惨不忍睹。不得已,我只好自己逐字输入,十分麻烦。正好笔者使用的也是汉王OCR软件,所以看了文章后,笔者立刻进行了试验,没想到识别出来的效果并没有该文作者所说的那么理想。可是既然别人都已经实践通过了,就说明方法可行。到底是哪个地方出了问题呢?
经过仔细观察各扫描参数,笔者终于发现了一点蛛丝马迹:扫描的分辨率被设置成了100dpi。会不会是因为该分辨率设置过低导致识别效率也相应降低了呢?抱着试试看的心理,笔者将扫描分辨率设为了200dpi,然后进行彩色扫描和识别,结果大有好转,但仍然存在不少错误。在将分辨率调整为300dpi后,需要改动的地方就已经很少了。看来,扫描分辨率对OCR识别的最后结果还是有着非常大的影响,所以大家千万不要忽视这个参数的设置。