美国IBM公司的研究人员最近发表一项新成果,宣布首次实现对手写印刷体连写字符的计算机实时准确识别,达到能处理字符连笔、字符相碰或字符重叠的新水平。以往研制的计算机手稿识别系统均只能识别满足特定要求的手写印刷体字符,即字母必须分开或写在规定的格子内。
这一研究项目的重点在于集中研制“稿类接口机”(Paperlike Interface),研究的最终目标是针对自然流畅的草体手稿实现计算机识别。连写字符识别的成功被认为已朝着这一目标迈进了具有重大意义的一步。
利用稿类接口机,使用者可用传感笔在透明的数字式书写台板上“写字”,台板下方则装有平板液晶显示器。由于书写台板上设有传感层,计算机能借此“感觉”到笔尖在纸面上的位置移动。笔尖的移动路径即以“电子墨迹”的形式显示在正下方的平板显示器上。
在手稿识别方法上,IBM公司有所创新。常规的识别方法被称为“先定笔划后识别”。所谓一个笔划是指笔尖在台板上从下笔到抬笔之间一次运行的路径。当有一组笔划输入计算机的存储器之后,一旦该组笔划正好构成计算机所能识别的某一单个字符则完成一次识别。按IBM的方法则与此相反,称为“先识别后定笔划”。按此方法,各种字样已被分解成计算机所能识别的笔划样型。于是手写的笔划可先与笔划样型作对照识别并加上标记,以表明这些笔划可能代表的字符所包含的组成部分,最后按照标记的顺序查对笔顺便可判定这些笔划是否与特写字符的组成部分相一致。
“先识别后定笔划”的方法具有几大优点:首先,单一的笔划样型能代表多种字符所共有的笔划,这样在笔划样型对照阶段能减少对比次数;其次,识别可按笔划逐笔进行,不必等到写完一个完整字符,因而快速而准确;再则采用笔划标记法,可降低对计算机机内固有功能如字库容量之类的要求,在识别过程的初始阶段即能排除那些不相干的字符或词汇;另外由于采用笔划对照法,使识别系统能够适应特殊用户的笔迹。
IBM的这项识别技术不仅适用于手写印刷体字符,它还可用于识别其它类型的笔迹,包括人手描画的各种示意符号,如线条、校对标记、数学符号和乐符等。这样,示意符号便可用作计算机指令,而笔可用于执行鼠标器一类的功能。照此看来,书写文字与示意符号的分析识别技术很有希望发展到键盘和鼠标器的普及程度,这对于计算机的使用与控制而言将是一种更自然更简便的新方法。(刘贵明 编译)
