识别手写识别

Author: Date: 2001年 22期

?牐犜旒皇蓖蚵氡继诘氖淙胧贝褚崖浠?流水春去也,取而代之的是赏心悦目的手写输入,惬意非凡的语音输入以及风驰电掣的OCR扫描输入。然而对大多数人而言,手写识别技术依然笼罩着一层神秘的面纱,让我们感觉无比亲近的手写因为科技的融入而显得有些陌生。为什么计算机能够识别手写?汉字手写识别技术的起源和发展历史究竟是怎样的呢?让我们一同在下面寻找答案!
  #1?牐犖淖质侗鸺际醺攀?
  ?牐牶鹤忠延惺?年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。人工键盘输入是指用手工击键方式按照一定的规则把汉字输入到计算机,目前已有数百种键入方案。但是当计算机袖珍到容不下键盘的程度(如个人数字助理PDA),编码输入就没有用武之地了。
  ?牐犑中词淙敕椒ǎ峭耆云匠5南肮撸岩淙氲暮鹤中丛谝豢榻惺樾窗宓纳璞干希ㄊ导噬鲜且恢质只牵衷谟械挠肫聊唤岷掀鹄矗梢韵允颈始#?。这种设备将笔尖走过的轨迹按时间采样后发送到计算机中,由计算机软件自动完成识别,并用机器内部的方式保存、显示。
  ?牐牶鹤质侗鸬姆椒ɑ旧戏治臣剖侗稹⒔峁故侗鹨约吧窬绶椒ǖ燃复罄唷4罅康牧中词侗鹣低巢捎玫亩际墙峁故侗鸱椒āK浇峁故侗鸱椒ǎ涑龇⒌闶呛鹤值淖槌山峁梗雍鹤值墓钩缮辖玻鹤质怯杀驶ǖ恪⒑帷⑹⑵病⑥嗟龋?、偏旁、部首构成,通过把复杂的汉字模式分解为简单的子模式直至基本模式元素,对子模式的判定,以及基于符号运算的匹配算法,达到对复杂模式的识别。结构识别法的优点是区分相似字的能力强,缺点是抗干扰能力差。统计识别方法是将汉字看为一个整体,其所有的特征是从这个整体上经过大量的统计而得到的,然后按照一定准则所确定的决策函数进行分类判决。统计识别的特点是抗干扰性强,缺点是细分能力较弱。
  #1?牐犑中词侗鸬姆⒄估?
  ?牐犃中醋址侗鸬姆⒄估房梢宰匪莸奖臼兰?50年代,伴随着手写板硬件(一种捕捉笔尖轨迹的数字化仪)的出现,人们开始研究联机手写字符识别技术。随着半导体和计算机技术的发展以及模式识别领域理论和方法研究的不断深入和完善,到80年代后期,联机手写字符识别技术的研究已经朝着实用的方向努力,特别是英文,已经开始研究完全无限制的整句识别技术。
  ?牐犃中春鹤质侗鸺际跸喽云鸩浇贤怼?1981年,IBM公司E.F.Yhap等推出了第一套较为成熟的联机手写汉字识别系统。该系统是基于对汉字进行笔划、字根编码的思想进行识别的。系统中每个汉字用72种字根拼成,而每个字根又可分解为42 种笔划的组合,通过对笔划和字根的判定识别所输入的汉字。而对字根进行的编码树表示又使得系统对通常的笔顺变化具有一定容错能力。当时对920个汉字的实验结果时正确率91.1%,对2260个测试,识别率为79.9%(第一次使用)。书写者要求使用工整楷书。
  ?牐牴诿商窨萍脊臼亲钤绱邮潞鹤质侗鸺际跹芯俊⒖ⅰ⑸墓局唬缭?1991年,就正式推出手写汉字识别系统。蒙恬的手写汉字识别技术的发展可分4个阶段:1.识别规整书写的、具有固定笔顺的楷体阶段。2.识别带有某些连笔、常见笔顺变化的楷体阶段。3.识别带有某些连笔、笔顺自由变化的楷体阶段。4.识别自由连笔、无笔顺限制的行书汉字。
  ?牐牰锌圃涸?1988年提出利用笔段为基元的联机手写汉字识别技术。该方法把汉字分为笔段、笔划、字根、单字和词组五个层次,分别用模糊属性文法进行描述,以启发式模板引导匹配。该系统采用了对笔段进行基于位置关系的排序方法,摆脱了对笔顺的依赖。由于对整个字形进行采样后分析,在识别速度上不如按笔顺采样计算识别快。
  ?牐犞档米⒁獾氖牵庖恍┐蠊疽部甲⒁饬中春鹤质侗鹫庖涣煊颉?Motolora、Microsoft、Apple等大公司均已经投资于该方向的研究。由于资金雄厚,并且具有很强的软、硬件优势,其势头不可小视。国内研究人员应该奋起努力,把这一具有浓厚文化特色的核心技术掌握在中国人自己手中。
  #1?牐犛跋焓侗鹇实囊蛩?
  ?牐犑侗鹇适鞘中春鹤质侗鹧芯恐凶钪匾幕方冢跋焓侗鹇实囊蛩匾彩鞘中词侗鸺际跹芯恐械哪训悖壳坝跋焓侗鹇实囊蛩刂饕幸韵录父龇矫妫?
  #2?牐?1.笔顺问题
  ?牐犛捎诓煌司哂胁煌氖樾聪肮撸驶氖樾此承蚓7⑸浠虼耍ゴ客üヅ浣惺侗鹉岩源锏嚼硐胄Ч6院鹤纸忻枋鍪保鼋霾捎靡晃簿拖缘貌还唬匦肜靡恍┒椒ɡ疵枋觯佣旨蟮卦黾恿似ヅ涞哪讯取?
  #2?牐?2.连笔问题
  ?牐犚话闳诵醋质倍疾换嵋槐室换厥樾矗私谑∈奔洌首质亲匀欢坏氖虑椋恍┬惺榱噬踔镣耆牙肓丝榈目蚣堋4邮涤媒嵌冉玻饰侍獗缺仕澄侍饩哂懈匾囊庖濉6杂诮峁故侗鸲裕室环矫媸贡驶掷啻蟠笤黾樱踔链锏侥岩怨槟傻某潭龋涣硪环矫妫视质沟帽识纬槿∧讯却笤觯蛭驶嵩黾右恍┤哂啾识危试斐傻幕溆只崾贡识畏较蜓现乩肷ⅰW苤什宦鄱杂诨谀闹只慕峁故侗鸲际茄暇奶粽健?
  #2?牐?3.相似字区分
  ?牐牶鹤种掷喾倍啵芏嗪鹤直舜酥浞浅O嗨疲纭凹骸⒁选⑺取比鲎窒嗖钪辉谙肝⒅洹J中春鹤值谋湫问盅现兀跹苁故侗鹣低匙プ∥⑿〉牟畋穑壳盎故且桓龇浅V档醚芯康奈侍狻?
  #2?牐?4.对抗干扰能力的要求
  ?牐牽垢扇拍芰Γ渤莆嘲粜裕杂诹中词侗鹣低车男阅苁欠浅V匾摹J樾词焙颍驶幕洹⒍В嘤啾识危ㄈ绫史妫┑牟迦耄值那阈保考湎喽晕恢谩⒋笮〉谋浠庑┒际蔷7⑸南窒蟆6杂诮峁故侗鹄此担嵩斐苫崛『褪侗鸬拇砦蟆4车慕峁故侗鸱椒ㄇ『迷诼嘲粜陨鲜潜∪趸方凇R虼耍肴〉煤玫男阅埽匦攵源呈侗鸱椒ń懈慕銮科渎嘲粜裕佣黾邮涤眯浴?
  ?牐牶驪C时代,各式各样新奇、小巧的PDA、手机、电子书(E-book)、信息家电(IA)等等信息产品被创造出来,但是这些产品几乎都有面板过小、输入不易的问题。就是PC的键盘输入,对大多数人来说也不是那么方便容易。手写输入必然会受到瞩目,因此,将手写识别技术移植并嵌入其他行业领域,将是手写识别技术未来发展的重要方向之一。