键盘输入从头说
专题快递
总的来说,键盘输入汉字是我们日常生活中使用得最多、普及性最广的一种输入方式,所以接下来我们将详细介绍键盘输入法。
一、汉字的国标码与机内码
我们知道,西文字符不超过128个,在电脑中采用1个字节(8位)可以完成所有西文字符的编码,ASCII码规定,西文字符的编码只使用字节的的第1位到第7位,最高位为“0”,这样使用7位二进制可编码的西文字符数最大可达2的7次方即128个,完全可以满足所有西文字符的编码需要。
汉字的个数比起西文字符来可就多得多了,我们使用的汉字大约有6万多个,即使是国家规定的最常用和较常用汉字也有6000多个,所以国家标准规定,每个汉字编码采用两个字节(16位)表示,并尽可能与西文的ASCII码一致,也就是说,汉字国标码的两个字节中每个字节也只使用字节的第1位到第7位,最高位为“0”。但这样一来,由于汉字国标码与西文字符的ASCII码每一个字节的最高位都为“0”,二者互相冲突,也就是说,如果内存中有两个字节,到底这两个字节表示的是一个汉字还是两个西文字符呢,二者都有可能,计算机很容易造成混淆。所以汉字的国标码是不能在计算机内部直接使用的,必须加以改变,改变的方法也很简单,也就是把汉字国标码两个字节中的每一个字节都加上128,相当于把该字节的最高位(第8位)的“0”换成“1”,其余7位保留原有数字不变,这种经过变换过的国标码就是计算机内部实际采用的汉字的机内码。由于西文字符的ASCII码都小于128,而汉字机内码的每一个字节都大于128,所以电脑就可以把汉字的机内码与西文字符采用的ASCII码区分开了。
二、汉字编码
汉字的输入其实就是汉字机内码的输入、识别和转换成汉字的过程。但输入汉字的机内码对普通电脑操作者而言几乎是不可能的,因为机内码的输入有难于记忆、输入速度慢、容易出错等致命缺陷,所以经过国内汉字输入专家学者的不断探索,研究出了许多实用的编码,对于普通用户而言只要输入这些简单编码,电脑就可以通过这些输入法软件自动完成由汉字编码转换成汉字机内码,再由汉字机内码转换成汉字的全过程。这些编码就是汉字编码。目前,我们国内有数百种之多的汉字输入方法,拥有广大用户群的汉字输入法也有几十种之多,尽管它们采用不同的汉字编码原理,但归纳起来可分为以下4大类:
1.音码
音码是根据汉语拼音为汉字编码,即取拼音中的声母和韵母为编码。音码最大的优点是学起来容易,只要你能正确读出汉字就可以用音码打出汉字,根本不用记忆。拼音中有23个声母、35个韵母和复韵母以及4种声调,它们组合起来能够拼合成字的共有417种,其中仅17种发音无同音字,其余400种全有同音字,这就带来一个问题──重码多,输入速度慢。还有对于那些普通话讲得不好的朋友,可能会觉得音码输入汉字难学难用,另外对于无法正确知道其发音的汉字也无法输入。大家比较熟悉的音码输入法有全拼、双拼、微软拼音输入法、紫光拼音、智能狂拼、拼音加加等。
2.形码
形码大都根据汉字的字形为输入依据,一般是把组字能力强的偏旁部首找出来作为字根,再研究一套拆分组码规则,用4个键为一个汉字编码,达到重码率低、输入速度快的目的,见字识码,对不认识的汉字也可输入。它的缺点是比较难以掌握,一般需经专门训练和花时间记忆字根。最常用的形码输入法主要有认知码、五笔字型码、表形码、郑码等。
3.对应码
对应码,也称为数字码,它是以各种码表为依据,用“对号入座”的方式输入汉字,一般是用4位数字给一个汉字编码。它的优点是完全不需要训练,一张码表就能输入字库内的所有汉字,而且没有重码。但输入速度慢,而且码表记忆困难,要记忆几千个4位数字的编码不是一般用户可以承受的。所以一般对应码只用于输入一些特殊符号和生僻汉字,是一种辅助输入法。这一类的输入法主要有区位码、内码、电报码等。
4.音形码
音形码是将音码和形码结合起来的一种编码。它一般是取读音中声母和字形中偏旁部首组成编码,如钱码取汉字的声母或首字母为第一码,取首偏旁或首笔划为第二码,取尾偏旁或尾笔划为第三码,是一种3键音形码。音形码集中了两者的优点如学习简单、输入速度快等,但也带来了两者的缺陷如不会读的汉字输入比较困难,要记忆汉字的偏旁部首等,这一类的输入法有自然码、钱码、智能ABC码等。