巧用OCR软件扫描矢量表格

IT商界

  笔者单位的扫描仪随机所配的OCR软件是尚书5号汉字识别系统,此软件扫描表格只能识别出非矢量表格,即所识别出来的表格边框线是由一条条横杠、竖杠等字符组成,无法像Word矢量表格那样自由调节,更不用说排版编辑了,因此扫描出来的表格没有太大的使用价值。后来在使用WPS2000时,发现它能够识别出横杠、竖杠字符组成的表格,并完全转化成为可自由调节的矢量表格,具体操作方法如下:

  表格扫描识别后保存为TXT文件,然后把TXT扩展名改为WPS,之后用WPS2000打开此扩展名为WPS的文件,表格已完全自动转化为矢量表格,表格线可自由调节,线宽可自由定义。如果想把此表格转化成Word格式,在保存文件时把保存类型选择为RTF格式即可,最后用Word 2000/2002打开此文件即可。

  现在市面上有一部分随机所配的OCR软件并不具备识别出矢量表格的功能,应用此方法可以很好地解决此类问题,当然最好还是在选购扫描仪时选择能够识别矢量表格的OCR软件。