巧用DC 也玩OCR识别
玩家阵地
相信很多朋友都有把一些书籍或报纸上的文字,输入到电脑中保存下来的想法。现在就教大家巧用DC,直接将书籍上的文字“转移”到电脑中,再也不用一个字一个字地敲键盘了,大大节约宝贵的时间和精力。
翻拍书籍有技巧
要想将书籍上的文字转移到电脑中,最初到工作就是要将信息数字化,就是利用DC对书籍或报纸进行翻拍。为了让电脑能更容易地识别出照片上的文字,在前期的翻拍工作中,要注意拍摄质量。
翻拍时,先将需要拍摄的书籍平放再桌面上,并使DC的镜头与水平面垂直,且处于书籍的中心点位置。镜头不要离书籍太近,可让镜头适当远离书籍,并调整相机,采用中等焦段拍摄书籍。这样做的目的在于减少照片的畸变,获得更真实的照片。此外,建议大家拍摄时,最好能使用三脚架,不仅可以抵消手抖动造成的相片模糊,还可以在光线不佳的情况下增加曝光时间,获得更明晰的照片。最后,还可以用Photoshop等软件来调节一下照片的亮度和对比度,突出照片中文字和背景的区别。
文字识别很轻松
数码相机不同于扫描仪,通常都不附带专业的OCR(Optical Character Recognition,光学字符识别)软件。其实,大家也不用到处去找OCR软件,Office 2003工具中的Microsoft Office Document Imaging就具有这样的功能。该软件不仅识别率高,操作也很简单,而且和Word兼容性也很好。
不过,Microsoft Office Document Imaging只支持TIFF格式的图片文件,所以要先用Windows XP的画图程序打开图片,将图片另存为TIFF格式图片,或者用ACDSee之类的软件将图片转换为TIFF格式。
启动Microsoft Office Document Imaging,打开图片文件,在菜单栏选择“工具→将文本发送到Word”项(如图)。系统会自动识别图片,然后将识别出来的文字和图片放到新的Word文档中,并且还可以保持原有的版式。如果原稿为英文,可点击“工具→选项”,切换到“OCR”标签页,在“OCR语言”下拉菜单选中“英语”项,可以提高文字识别的正确率。

如果电脑上没有安装OCR软件,也不要紧,只要能接入互联网,就可以使用免费的在线识别服务。例如http://www.netocr.net/,该网站采用清华大学研制的OCR技术,支持BMP、JPG、TIFF三种图片格式,能够对简体中文、繁体中文、英文、日文、韩文以及手写体等进行识别,整个过程非常简单,感兴趣的朋友不妨试试。不管是把书籍电子化后收藏,还是引经据典写论文,该方法都能帮上大忙。