汉字输入法的学习

Author: 河南 郭金良 Date: 1996-06-07

        一、编码技术
        编码技术是指依据汉字的信息,对每个汉字编制一个代码,通常为数字串或字符串,此代码即为该汉字的输入码。
        汉字输入码根据其编码的规则不同分为流水码(整字编码)、音码、形码和音形结合码四种。下面以初学者常用的全拼音码和五笔字型为例浅谈汉字的编码技术。
        1、音码
        音码是抽取汉字音的信息,以国家文字改革委员会公布的汉语拼音方案为基础而进行编码的。根据编码规则的不同,一般有全拼、简拼、双拼等类型拼音码,其中以使用不带声调的音码较多。如全拼单码,把汉字的全部拼音字母作为汉字的编码(注:一般键盘上没有的拼音字母ü用V或U来代替),所以全拼音码与汉语拼音有直接的对应关系。如:汉字“中”的发音为zhōng,则其全拼音码为zhong;汉字“女”的发音为nü,则其全拼音码的nv。
        音码符合国家语言文字政策,对会讲普通话或懂得汉语拼音的人是易学易用的方法,特别是对中、小学生学习汉字拼音很有帮助。但此类编码由于汉语中同音字较多,所以重码率较高,且无法为不会读的汉字编码。目前随着拼音输入方法研究的不断深入,拼音码输入法正在向词语化、智能化方向发展。
        2、形码
        形码是根据汉字的字形来确定汉字的编码。其编码方法是:利用汉字字形固定的特点,把每个汉字拆分为多个部件(笔画、字根或形符),每个部件给一个代码,并把这些代码分组定义到微机键盘上,考虑到汉字结构复杂、笔划多少不一等,又对拆分顺序、编码规则等作严格的规定,输入汉字时,只要按规则依次输入部件代码即可。也就是说,把输入汉字的问题转化为依次输入汉字部件代码。如形码的典型代表五笔字型(王码),王码选以125种(含五种基本笔画)汉字部件,采用分区划位的方法把这125种部件定义到键盘的25个英文字母(A-Z)上,然后依照汉字分解为字根,字根拆分为笔画的拆分总则把汉字分为两部分:健面字和键外字,键面字分为单笔画、键名字及成字字根;键外字分多字根、四字根及不足四个字根字。拆分规则有成字字根拆分为笔画和键外字拆分为字根两种。然后按单笔画、键名字的编码规则及成字字根和键外字的拆分和编码规则进行编码,并限定码长最多为四码。另外为提高输入速度,王码还有高频字、简码、词组等编码规则。
        形码不考虑汉字的读音,不受方言的干扰,与汉字的对应性强,见字识码,一般重码率低,输入速度快。但形码拆字方法没有统一标准,编码规则繁,记忆量大,需要一定时间的学习才能掌握。
        二、输入技术
        输入技术是指怎样依照编码把汉字输入计算机的技术。下面以UCDOS3.1下的全拼输入为例介绍输入技术中所包含的一般步骤:
        1、启动汉字系统
        启动汉字系统即建立一个汉字环境,为输入、输出及处理汉字创造必须的条件。如启动UCDOS3.1,在DOS提示符下执行“UCDOS 回车”。
        2、挂接相应的汉字输入模块
        目前一般优秀的汉字系统除区位码输入法外,多采用外挂汉字输入模块来灵活配置系统的汉字输入法,以节约内存,提高系统处理速度。如在UCDOS提示符下,执行“PY 回车”,即把全拼音挂接到当前系统中;执行“WB 回车”,即把五笔字型挂接到当前系统中。
        3、将西文输入方式转换为相应的汉字输入方式
        此法多采用功能键组合方式来实现,但不同的汉字系统定义一般不尽相同。如UCDOS3.1下,同时按〈ALT〉+〈F2〉进入全拼音输入方式;按〈ALT〉+〈F5〉进入字型输入汉字。
        4、依照编码输入汉字
        此步骤为具体输入过程,不重码汉字直接输入编码即可完成输入,对衙码汉字可细分为:输入编码→找字→选字→重复选字。
        输入编码:使用英文小写字母输入汉字编码;
        找字:由于重码汉字采用分页显示法,屏幕底行上显示的一组重码汉字为当前页,如果当前页没有所需汉字,可用如下操作键找字,“+=”、“>.”或“}]”显示后页,“-_”、“<,”或“{[”显示前页;
        选字:在找到的重码汉字中,输入所需汉字对应的代号;
        重复选字;若当前页已选过汉字,还要在当前页选字时,必须采用恢复当前页操作〈ALT〉+〈n〉进行选择,命令中“n”为所选汉字的对应如:在UCDOS3.1全拼音输入方式下,输入“谢谢”,输入编码“xie”,当前页有,输入“谢”对应的代号“4”,即完成第一个“谢”的输入,然后按“ALT”+“4”可重复输入第二个“谢”字;又如汉字“朱”,输入编码zhu,当前页没有,按“+=”显示后页,找到该字后,输入“朱”对应的代号“7”,输入守毕。
        通过以上分析,初学者应根据自己的实际需求选择适合自己的汉字输入法,若对拼音较熟悉,则拼音输入法应是首选,输入速度要求不高时可选全拼、简拼及双拼,要求较高时选自然码、智能ABC等,若不懂汉语拼音,或要成为专业录入人员,则只好选择形码,如五笔字型、郑码、表形码等。通常学会两种输入法以便在输入过程中相互弥补不足,最好音码和形码务学一种。学习输入法时,应首先分析是如何编码的,然后学习该输入法在具体汉字系统下的输入技术,只要综合理解两方面的内容,边学边用,学用结合,就能在较短的时间内学好、用好汉字输入法。