键盘不是唯一 ——非键盘输入法的特点与技巧

Author: 张海波 Date: 2000年 第19期

    什么是非键盘输入法?当然就是不使用键盘就可以进行文字录入的方法。它主要适用于需要进行一定量的文字输入,而又不希望花大量时间去熟悉键盘、学习输入法的人。本文将向你介绍目前主要的几种非键盘输入法以及使用技巧,帮你选择一种最适合你的方法,从而助你更加高效地完成文字录入工作。
#1    非键盘输入法的特点
  目前,实用化非键盘输入法主要有三种形式:语音识别输入法、手写输入法和扫描输入法。下面就先来介绍一下它们的特点和优势。
  一、语音识别输入法
  语音识别输入法,顾名思义就是你把文字读出来,电脑帮你将语音转化为文本并记录下来。所以,语音识别输入法应该说是最简单易用的一种输入方法了。另外,语音识别所需要的硬件投入也是比较少的,在获得了语音识别软件后,你只需配上一个麦克风,就可以开始工作了。现在市场上的语音识别软件基本上都是使用IBM公司研制开发的ViaVoice语音识别系统作内核的。ViaVoice 4.0版本要求机器的配置为:CPU主频高于166MHz,内存大于16MB,当然还需要声卡了 ;但是要想获得比较好的效果,需要主频在200MHz以上的CPU,32M以上内存的环境来使用它(就这种配置来说,对现在的机器也不算高吧!)。ViaVoice的新版本ViaVoice98具有更好的效果和更多的功能,但要求的配置也更高一些。一种语音识别软件的优劣是以它的识别率(语音识别系统正确识别语言的比率)高低来判断的。语音识别的正确率不可能是100%,而且它与你录入的内容息息相关。语音识别技术是针对标准的汉语语法和常用词汇制作的。所以,对语法标准、常用词汇的文章,识别率会很高,可以达到95%左右;对于含有专业词汇,语法较为特殊的文章,识别率就只能达到80%~90%了;而如果让语音识别系统去识别一些古文、诗歌等非现代语法的东西,识别率就可能会惨不忍睹了。正因为语音识别的正确率不能达到100%,所以,语音识别之后,还需要用其它输入法来进行修改。严格地说,单独使用语音识别输入法,还不能实现真正的非键盘输入。
  二、手写输入法
  手写输入法基本上沿袭了人们日常中的书写习惯,所以也最容易被人们接受,同时它又可以发挥电脑在编辑、修改等方面的优势。由此看来,手写输入法是一种方便而且易于接受的输入方式。在熟练掌握了“电脑笔”之后,用它输入甚至比用普通笔写字还要快(因为你不再需要注意字体的工整,只要电脑能够识别就达到了目的)。中文手写产品从80年代发展至今已经相当成熟。生产中文手写输入产品的公司也很多,像汉王公司的汉王笔,北大方正的如意笔,摩托罗拉公司的慧笔,台湾蒙恬公司的蒙恬笔,清华紫光笔等等。
  三、扫描输入法
  扫描输入法应该是非键盘输入法中速度最快、而局限性也最大的一种输入方式了。它只适用已经存在于纸面上的文字进行录入工作,先利用扫描仪将材料扫描入电脑,再经过OCR软件的识别自动转化为文本。每页材料从扫描到识别全过程用不了两分钟。所以,当需要将书籍等材料重新录入进电脑时,扫描输入法无疑是你的首选。扫描输入法当然离不开扫描仪,所以你得为你的电脑添置一台扫描仪,一般千元以下的家用型扫描仪就行了。
#1    非键盘输入法的使用技巧
  以上是三种非键盘输入法的特点,下面来具体介绍使用技巧。
  语音识别输入法:ViaVoice语音识别系统使用起来很简单。先安装ViaVoice语音识别系统,安装过程比较简单,这里就不多说了。然后装好麦克风,启动“语音板”程序,点击“开始听写”按钮,这之后你读出的每一个字音电脑都会进行识别。但ViaVoice是一套连续语音识别系统,所以,你应该连续地读出你想输入的内容,并按一般的语言习惯进行断句。但是你很快就会发现这时的ViaVoice的识别率并没有介绍的那么高!没错,因为IBM ViaVoice的惊人之处正是在于它的一套口音适应系统,它可以帮助电脑了解你发音的特点,从而提高识别效果。你所要做的只不过是运行“口音适应”程序,按提示念出系统给出的256句话,之后让电脑自己分析一下就大功告成了。千万别嫌念256句话太多、太累,口音适应可以大幅提高识别率,绝对是一劳永逸,使你以后的工作事半功倍。而且IBM ViaVoice支持口音适应的备份、恢复和多用户系统。你可以方便的将自己的口音适应结果进行备份,以后就再也不用去念那256句话了。如果几个人在同一台电脑上使用ViaVoice,可以在“ViaVoice属性”中分别建立自己的用户档案,然后创建相应的口音适应。以后每次变换用户时,只须到程序“ViaVoice属性”中将用户姓名更改成你的名字,系统就会自动根据你的口音特点来进行识别了。
  与语音识别系统相比,手写输入法可供选择的种类就比较多了。其实,一般用户只要注意几点关键的技术指标就可以了。第一个指标当然也是识别率的问题,手写输入的识别率包括很多种,像首选识别率,是指识别出的第一个字即正确的比率;十选识别率,是指识别出的前十个候选字中正确字的比率;还有一级字库识别率,二级字库识别率,以及加权识别率。一般广告中使用的识别率应该是首选识别正确的加权识别率。但必须说明的是手写输入产品的识别率是对产品而言的,但它与个人书写是否工整相关。像人们写字一样,有的人写字就好认,有的人写的字就需要根据上下文去判断。所以,在选购手写产品时,看广告中的识别率是一方面,亲自试一试才是最可靠的。需要注意的第二个指标是识别连笔的问题。不用说,手写识别系统当然对工整的正楷书写具有最好的识别效果,但要求用户都用正楷来进行书写肯定不现实,也不可能达到人们期望的录入速度。所以,现在的笔输入系统都支持连笔识别。第三个指标是笔顺限制问题。这涉及到手写识别系统的识别机理,现在多数的手写识别产品是整字识别,即当你写完一个字之后,才对整个输入过程进行识别,这样当然不存在什么笔顺问题了。而另一种识别方案是渐进识别法,它利用电脑领域的类神经网络技术,根据中国汉字的特点,通过笔划、笔顺对用户的输入进行识别。每输入一笔,就更新一次备选字,往往一个汉字不用输完就可以识别出来。二者比较,各有优劣,当然尽可以按个人的喜好来选择。
  扫描输入法使用起来也很简单。首先要做的当然是正确安装扫描仪和OCR软件,之后的全部工作都可以在OCR软件中进行。将需要录入的材料放在扫描仪中,点选OCR软件中的扫描按钮,稍等片刻,你就可以看到被扫描进入了电脑的材料已经呈现在了屏幕上,再选中识别按钮,机器就可以自动将他们转化为纯文本了。
  在使用扫描输入法时需要注意一下扫描分辨率和版面分析两个问题。先来谈谈扫描分辨率的问题。扫描的分辨率越高,其结果当然就越清晰,识别率也会同时提高;但是,识别率是不可能无限提高的,而且它的变化过程也不是线性的,同时,你选择的分辨率越高,扫描的速度也就越慢,存储图像的文件也越大。这就存在一个选择最优的问题。以一篇比较清晰的文稿(A4幅面,五号字共计1483个)做实验,所选分辨率,扫描速度和识别率情况如下^19050101a^表:
  由此不难看出,比较合理的分辨率是200dpi~300dpi,当然,具体数值需要根据材料的清晰程度而定,可以稍作调整。
  再来谈谈版面分析。对于一般通篇的文件进行扫描识别当然不存在什么版面分析的问题。但是如果要扫描一些类似报纸等进行过排版的材料,这时你就得告诉计算机哪一部分是需要识别的文字,哪一部分是插图不需要识别;哪一部分文字在前面,哪一部分文字在后面。一般OCR软件具有自动进行版面分析的功能,你只要选中它即可,但对于排版比较复杂的材料,你还得自己动手分析一下,这样更保险些。此外,你还会在工具栏中找到一个倾斜校正的按钮,它当然是用以扫描材料没摆正所造成的图像倾斜的。
  怎么样,你打算选择哪种非键盘输入法呢?其实,客观说它们各有优劣,全看你的用途了。选择好适合自己的非键盘输入法,它一定能帮助你轻松完成文字录入工作。