计算机汉字输入的根本性革命

Author: 中国科学院自动化研究所 刘迎建 Date: 1995-05-05

        计算机自1946年诞生一直在文字信息处理和办公自动化方正发挥重要作用。中国经济的发展,要求管理者都必须是计算机的使用者。然而,计算机在中国应用推广由于大众汉字输入难而困扰。多少年来,人们十分渴望用最自然,最方便的笔书写来直接输入汉字。时正今日,梦已成真。
        一、要让中国人都能方便地输入汉字
        汉字负载着中国灿烂辉煌的历史文化,是五千多年中华文明的象征。计算机的出现,作为现代化的工具,把人类带进伟大的信息时代,使社会文飞跃发展。西方是拼音文字,英文仅用26个字母的键盘就能全部包括。汉字属象形文字,用英文键盘输入,有先天困难。但是汉字与西文比较,优点是汉定表达能力强,汉字本身的含义深广,每个字都表文特定的意义,组成语言十分精练,仅用很少的汉字就可构成大量的词。而项文仅26个字母,构词能力很有限。用计算机处理文字,表达同样概念的汉字入英文,汉字用字少,存储运算量小,汉字比英文更便于电脑处理。电脑在中国的普及应用,首先是要人人都能容易方便把将汉字输入计算机。如何使古老的独有体系的汉字与控科技事物计算机相互完美的结合应用,让中国的使用者都能轻轻松松方便地使用电脑,这是对中国科学技术的历史性挑战。
        二、拆字组码已经不重要了
        近十多年来,在中国已有几百种汉字编码输入方案。最流行的五笔字型安死记硬背130多个字根和众多的一、二级简码,一般人要学几个月才能胜任。面对英文键盘和拆字组码的输入方法,使非专业人员望而却步。另一方面,键盘输入需要相对安定的工作环境,而很多电脑使用者的工作具有流动性。计算机日趋向微型化发展的大趋势,大大破坏了键盘的优势。随着计算机软硬件技术的发展,使拆字组码,键盘输入已经不那么重要了。用笔书写来直接输入汉字,操作电脑成为人们期待最高追求。经过十多年锲而不舍地努力,中国科学院自动化研究所和北京中自智能公司开发出当今最高水准的中文手写体汉字字符识别技术成果__汉王九建筑物和汉王笔。
        三、今后十年是笔输入的十年
        中国普及计算机应用,一定要有一种真正方便多用的汉字输入方法,最简便的方法莫过于直接用笔书写输入电脑。汉王九九和汉王笔实际上是一个联机手写输入字法:由一支笔,一块供书写用的与计算机相连的手写板以及识别软件构成;使用时,用笔在手写板上写汉字,计算机实时地记录整个书写过程,由识别软件授手写体识别为计算机内码汉字;可以代替各种键盘偏码汉字输入方式,以人们最自然的手写方式输 入汉字。只要不是文盲的人,都能够使用电脑。汉王笔输入解决了绝大多数人使用计算机的困难,为电脑在中国的普通扫清了一个关键阻碍,中国将再次掀起电脑应用的新流潮。据统计,1992年,笔式电脑的销售量达20万台。据IDC予测:到1996年和笔式电脑将成为重要的机种,全球销量将500万多,如果每台以2000美元计算,该类产品的营业额将达到100亿美元。
        四、汉王笔的研制经过和应用前景
        北京中自智能系统公司的前身是中国科学院自化研究所文字识别实验室。在其雄厚的技术积累和国家“八六三”高技术支持下,建立了一支以教授、博士、硕士组成的中国此专业最其实力的高科技队伍,是集科研、生产、销售、体化的高新技术企业。到目前为止,已陆续开发出汉王五个版本,并于1990年获得国家发明专利;1992年获中国科学院科技成果一等奖。国内外多家公司对4.0、5.0版表示了级大的会作兴趣,目前已被美国、日本、韩国、香港、台湾等地的多个著名计算机公司造中,已准备购买5.0版技术或使用权和经觥权的有COMPAQ、IOTEL、MOTORA12、APPLE、CIC、ACER、HITACHI、SAMSNG及中国的四通,联想、方正、晓军等公司。
        五、发展展望和开发计划
        1.技术发展方向:
        ①提高联机手写汉字识别软件的性能。
        ②提高软件的兼容性,能支持更多的中文操作写作和应用软件。
        ③开发专用的联机手写汉字识别系统。
        ④授联机手写汉字识别与笔电脑、笔式PDA等产品更紧密地结合。
        2.汉王九九第六版的进一步开发计划:
        ①为提高识别适应性学者关多的ON-Iine手写汉字样本。
        ②为加快开发周期,识别用Database准备以自动生成为主,并适当进行人工修改。
        ③增加英文连笔、英文单词识别功能。
        ④进行ON-Line日文、韩文的识别研究。
        六、5.0版的性能指标。
        汉王联机手写汉字识别系统5.0版的主要性能指标如下:
        书写要求:行书,笔顺不限,能识别大部分正常书写的连笔。
        识别字数:13000多个,包括二级国标6737个汉字,繁体5401个汉字及常用异体字。
        识别率:楷书98%,行书95%。
        兼容性:能在各种8080-80486为CPU的微机、PDA上运行。
        内存使用情况:变量48K、程序20K,数据300人。
        应用环境:均可在简体和繁体中文操作可统下运行。
        能5和已有的各类系统和软妆桂接,将386以上的电脑变成
        笔式电脑,任何软件变成笔式软件,可取代键盘和鼠标器的操作,只需要一支笔就可控制整个电脑系统。
        七、汉王九九的支持软件。
        中自智能公司一直非常重视汉王联机手写汉字识别软件的兼容性。新开发的联机手写流字识别系统3.0版、4.0版、5.0版均支持各种中文系统,能够在DOS提示符下及各种汉字编辑软件中手写输入汉字。在中文WINDOWS下,不令可以用汉王笔代替鼠标进行任何操作,而且可以完全代替键盘输入汉字、英数字、标点等。另外,还开发了一批汉王手写汉字识别系统的支持软件,其中包括:1.汉王中文系统;2.汉王手写编辑器;3.汉王大众排版系统;4.汉王触摸屏;5.汉王ICR。
        汉王手写汉字识别技术的发展改变了中国汉字输入的原有格局,打破了键盘输入的一统天下,为电脑在中国的普及应用解除了一个最大障碍,应当大力宣传和支持这项技术的推广运用,促进中国的现代化建设。