汉字笔输入的原理与性能介绍
#2 一、笔输入原理
联机手写汉字输入方法与汉字编码输入法有着本质的不同,学术界、产业界已经充分肯定了以联机手写汉字识别技术为核心的汉字输入产品的推广价值。笔输入的原理是用一支定位笔(Stylus)在一块与电脑相连的书写板(Tablet)上写字,根据压敏或电磁感应等原理将笔在运动中的座标位置不断送入电脑,电脑中的识别软件根据采集到的笔的运动轨迹来识别所写的字,把得到的标准代码作为结果储存起来。这种输入方式对于习惯用笔写字的人来说当然更为自然,更易被接受。笔输入方法的核心技术是识别软件,即联机手写汉字识别软件。联机手写汉字识别中的“联机”(On-Line)是相对于手写体汉字OCR来说的。后者是通过光学扫描装置把预先写在纸上的稿件的文字图像讯息送到电脑加以识别,而不是边写边识别,所以有时也称脱机手写汉字识别。对脱机识别来说,识别软件所获取的唯一讯息是文字图像上各像素之间的空间位置关系讯息。而对联机手写识别软件来说,由于采集到的是书写时的实时讯号因而可以利用除了文字图像各像素之间的空间位置关系讯息以外,还有它们之间的时间关系讯息。由于讯息量的丰富,使得联机识别的难度要低于脱机识别。
#2 二、主要性能
下面就目前市场上见到的产品,谈谈笔输入产品的主要性能指标:
#3 1.笔迹显示:
上面提到的书写板从笔迹显示的功能来看主要可分为两类。一类是普通作图用的数字化仪,其分辨率一般可达1000LPI以上,但对于手写汉字识别,500LPI就足够了。这种数字化仪本身不能显示笔迹,要由软件将笔迹显示于电脑屏幕。为了解决低头写字抬头看笔迹的矛盾,有的识别系统将笔尖的位置也在屏幕上显示出来,随着笔的移动,屏幕上的笔尖也在移动并画出笔迹,这样,书写者可以只看屏幕而不看书写板。但对于习惯低头写字的人可能也不方便。
另一种书写板本身就是一块液晶显示屏,一边写字一边就在笔下显示出笔迹,用起来十分方便,但价格要比前一种贵得多。对于识别软件来说,采取何种笔迹显示方式只是一个硬件配置问题,软件实现上没有多大区别。
#3 2.识别率:
各种产品广告中所宣称的识别率可供参考。我们曾经对市场上常见的产品找过一些人试写,平均识别率一般也只是80%多。但一般的识别系统都提供多达10个字的候选字,如果识错而选字中有正确的字,只要用笔点一下相应的候选字号码即可纠正。而候选字的正确率一般在90%以上。这样的识别率能否实用?我们不妨把它与拼音输入作一比较:写一个字的时间与敲一个字的拼音字母所需的时间大致相等。拼音也有拼错需要重拼(特别当南方人碰到CH、SH、ZH等声母时),假定10%的字需要重拼,这与联机手写识别10%识错而无候选字需要重写的情况相比,两者所花的时间也大致相等。拼音正确的90%的字都至少击一次键选候选字(有的还要翻屏,击多次键),而手写输入80%正确的字不必挑候选字,只有10%的需要用笔点一下挑候选字,这样看来,手写输入即使在目前这种识别率也下远远优于拼音输入,何况,手写输入的识别率还在不断改善之中。这里有一个概念上的区别:联机手写识别由于其边写边识别的使用特点,不能照搬通常对OCR的识别率要求。
#3 3.识别速度:
对联机手写识别来说,只要识别速度跟得上写字的速度就行了,因此,这项性能一般不成问题。大部分识别系统在386微机上识别速度平均可达0.5~1.0秒/字。
#3 4.写完一字的结束控制:
由于汉字笔画多寡不同,写完一个字得把写完的讯息通知识别系统。早期的识别系统在书写板上定义了一个“写完”键,书写者每写完一个字要用笔点一下这个键,现在个别系统仍用这种方法。它的缺点是给书写者增加了额外的操作负担,且与平时写字的习惯不一致。目前,大部分系统采用以下两种方法控制:①时钟控制:规定笔抬起后在多长时间内(例如0.5秒)不落笔就认为该字已写完。为了适应不同用户的书写速度,有的系统允许用户调整时钟参数。这种方法的优点是减少了用户的操作,但常常容易发生一个字的书写过程中由于某两个笔划之间停顿时间稍长被强行肢解成两个字,而造成误识。②笔的位置控制:在书写板上划分出几个方格书写区域,每格写一个字,几个格交替轮换使用。一个字写完后,只要把笔移到另一格,即使不落笔也表明上一字已写完。这样,书写者可以快速不受限制地在各个方格内轮流写字,这更接近于平常在方格稿纸上写字的习惯。也有的系统把以上两种方法结合起来进行控制。
#3 5.西文字符的识别:
文章中不可避免地混有西文字符(包括英文字母、阿拉伯数字、标点符号及其它常用符号),有的系统只能识别汉字,而对西文字符采用模拟键盘的方式输入,也有的系统既能识别文字,也能识别手写西文字符。显然,后者在性能上更适应人们写字的习惯。
#3 6.模拟键盘:
一般的识别系统都在书写板上划出一块固定区域作为模拟键盘,该区域内分成许多小方格,每格代表真实键盘上的一个键。使用者只要用笔点一下某个小方格,该方格所代表的字符(包括控制符)即被输入电脑,从而可以摆脱原有键盘而完全用笔实现键盘操作。
#3 7.鼠标功能:
从书写板传输到电脑的不仅有笔的座标讯息,还有笔的状态讯息。笔的状态讯息包括笔头在压板或离板。只要笔离板不超过规定的距离,笔的座标讯息仍然保持。此外,笔杆上一般还有一个或多个开关,开关的状态也被输入电脑。这样,当笔离板移动时,笔就完全可以起到鼠标的作用。必须指出,对于压敏式的书写板不具有此功能。
#3 8.自定义词:
在书写板上划出一个固定区域为自定义词区域,该区域划分成带编号的小方格。预选经过一定的操作可把自己常用的词语加以定义并赋以一个编号储存起来,使用时只需将笔点一下自定义词区中的某个小格,该格的编号所对应的词语即被输入。
#3 9.学习功能:
一般的识别软件都在电脑中保存一个识别字典,该字典中记录了每个字的特征。每写完一个字,识别软件就提取所写的字的特征,并与字典中每个字的特征比较,找到特征最相似的字作为识别结果。当一个字识错时,表明字典中对应这个字的特征描述还不全面,这时,用户可以通过一定的操作让识别软件把他所写的字的特征补充到原来的字典中去,也就是让电脑进一步熟悉人的写字特征。这就是电脑学习功能。学习功能有利于使电脑不断适应人的书写习惯而使识别率不断提高。现有的产品中有的已具备学习功能,随着电脑使用的个人化,这种学习功能将越来越显得必要。
#3 10.连笔书写:
按照书写的笔划之间相连以及笔划变形的程序,汉字可分为楷书、行书和隶书。由于行书和草书的字形没有统一的规范,不同人书写的字形差别很大,因此识别的难度很大。目前的产品一般都要求楷书或在楷书的基础上允许适当的连笔。完全正规的楷书对书写者来说可能是一种苛求,在楷书基础上允许常见的习惯性连笔可能是一个切实可行的又能被用户接受的要求。连笔程序的不同对识别软件来说不仅仅是工作量的不同,而且在识别算法上也需要有限的变化。因此,允许连笔的程度是衡量一个识别系统性能高低的重要指标。
#3 11.对汉字系统的支持:
联机手写字识别系统需要在汉字操作系统下运行并与相应的汉字编辑器(即汉字系统)相连。目前各种汉字系统繁多,尽管功能大同小异,但都不能完全兼容,而不同的用户又习惯于使用不同的汉字系统。要想让汉字识别系统同时支持所有的汉字系统是比较困难的,目前的识别系统一般只支持某几种系统。
#2 三、汉字笔输入的发展方向
汉字笔输入系统今后将向以下几个方向发展:
1.提高笔输入识别软件的性能,这包括:放宽对书写的限制,更好地识别行书;加强软件的学习功能,提高软件的适用性及识别率。
2.提高软件的兼容性,使其能支持多种中文操作系统和应用软件。
3.开发专用的联机手写汉字识别系统。针对某一特殊应用领域,采用相应的办法、硬件,开发便宜且高性能的系统。例如,在某些应用软件中,只要求填写数字,在此情况下,专门作一个联机手写数字识别系统代替笔输入软件,可以将识别率提得很高。
4.将笔输入系统与输入电脑,笔式PDA等产品更紧密地结合在一起。笔输入系统的发展方向是越来越接近人们传统的写字习惯。但这决不是很容易达到的目标,在这一点上,各家笔输入系统都还有相当长的路要走。如:上下文相关自纠正处理,自学习功能,自然连续书写辨认等。
当然,如果期望手写输入完全和人们写字一样那是不可能的。因为每个人写字的习惯太多变了,有的人甚至过段时间连自己写的字都不认识,作为笔输入系统的发展来说,若能尽可能考虑人们的写字特性,越来越接近人们的写字习惯,笔输入系统将会得到迅速发展和更广泛的应用。