消除水印文字识别的影响
整机外设
自从办公室采购了一台扫描仪后,大伙不约而同变得“懒惰”起来,什么东西都要拿来扫描一下,好像生怕扫描仪会“偷懒”一样。这一天,一个同事就拿来一本《国家标准》说要把它扫描成可以编辑的文本格式。本来印刷字体扫描起来并不费力,可《国家标准》每隔一页便会有一个非常醒目的红色水印,因此同事在扫描完成后识别时得到的都是一大堆的乱码。无奈的同事只好求教于笔者。刚开始笔者考虑在完成图像扫描后将水印剔除,可水印的面积实在太大,而且和文字都是重合的,无法单独消除,所以只好作罢。
经过仔细观察,笔者发现除了水印是红色的外,其他的文字都是黑色的。此时,我想到了彩色扫描。因为笔者使用的识别软件是汉王OCR5.0,具备识别彩色图像的能力,因此笔者想是不是能够通过彩色扫描让软件将图像中色彩不同的部分进行过滤,只对文字进行处理。于是,笔者将扫描模式设置成为了彩色识别模式,其他参数并没有做任何调整。在进行识别区域的选取时,笔者也没有刻意避开水印部分。没想到识别后的效果令人非常满意,基本上没有受到水印的影响!为了确定结果,笔者又挑了几张有水印的文章来进行尝试,发现只要使用的是彩色扫描模式,都能够顺利识别,再也没有乱码的烦恼了。
经过实践,尚书OCR软件也支持对彩色图像的识别。如果你正在为文章有水印,扫描后无法识别而烦恼,就赶快试试这种方法吧!