用普通传真机实现OCR
外设领域
由于笔者要进行2万多字的打印稿录入,于是就想到用扫描仪进行OCR识别。可是当时身边并没有扫描仪,只有电脑、传真机和Modem,于是利用这些硬件,笔者想办法成功地进行了稿子的OCR识别。
一、硬件要求
1.普通传真机
2.Modem(连接电话线,接入电脑)
3.电脑
二、软件要求
1.Windows XP Professional (笔者为SP1)及传真组件
2.Microsoft Office 2003 组件(Microsoft Office Document Imaging)
三、实现步骤
1.安装Windows XP Professional 传真组件。这一步可以通过Windows XP的“添加或删除程序”完成,如图。

2.安装Microsoft Office 2003 及Microsoft Office Document Imaging组件,这可以利用Microsoft Office 2003安装光盘完成。
3.连接好Modem及电话线。
4.设置电脑传真组件(设为A),在“开始→程序→附件→通讯→传真→传真控制台”中将电脑设置为可以自动接收传真。
5.将需要识别的文件通过普通传真机(设为B)发送到电脑上。
6.电脑传真A接受到B发来的传真。
7.电脑打开接收的传真,图片格式为TIF,即可使用 Microsoft Office Document Imaging 查看、管理、读取和识别图像文档和传真中的文本。
四、总结
以上操作容易进行,利用硬件设备简单,在没有扫描仪的情况下进行了文字的OCR识别。成本为几分钟的市话费用,若电话是内线则连电话费都省了(笔者用的是内线电话)。组件Microsoft Office Document Imaging功能强大,笔者手中打印稿95%都能正确识别,还可以把编辑的文档(不用打印),直接发送成传真,节省办公耗材,具体用法就不详细介绍了。