用普通传真机实现OCR

外设领域

由于笔者要进行2万多字的打印稿录入,于是就想到用扫描仪进行OCR识别。可是当时身边并没有扫描仪,只有电脑、传真机和Modem,于是利用这些硬件,笔者想办法成功地进行了稿子的OCR识别。

一、硬件要求

1.普通传真机

2.Modem(连接电话线,接入电脑)

3.电脑

二、软件要求

1.Windows XP Professional (笔者为SP1)及传真组件

2.Microsoft Office 2003 组件(Microsoft Office Document Imaging)

三、实现步骤

1.安装Windows XP Professional 传真组件。这一步可以通过Windows XP的“添加或删除程序”完成,如图。

41-b12-2.jpg

2.安装Microsoft Office 2003 及Microsoft Office Document Imaging组件,这可以利用Microsoft Office 2003安装光盘完成。

3.连接好Modem及电话线。

4.设置电脑传真组件(设为A),在“开始→程序→附件→通讯→传真→传真控制台”中将电脑设置为可以自动接收传真。

5.将需要识别的文件通过普通传真机(设为B)发送到电脑上。

6.电脑传真A接受到B发来的传真。

7.电脑打开接收的传真,图片格式为TIF,即可使用 Microsoft Office Document Imaging 查看、管理、读取和识别图像文档和传真中的文本。

四、总结

以上操作容易进行,利用硬件设备简单,在没有扫描仪的情况下进行了文字的OCR识别。成本为几分钟的市话费用,若电话是内线则连电话费都省了(笔者用的是内线电话)。组件Microsoft Office Document Imaging功能强大,笔者手中打印稿95%都能正确识别,还可以把编辑的文档(不用打印),直接发送成传真,节省办公耗材,具体用法就不详细介绍了。