会做翻译工作的机器——电子计算机的新应用

🏠 首页 《无线电》杂志 1957年 🔗 第10期 🔗 第4页 分类:短讯 🔗 羽 🔗

大家都知道,用电子计算机来解决数学问题是非常方便的。但是利用电子计算机的原理,又有了新应用,即直接翻译文件。看起来用机器来作翻译工作好像是不可能的,其实不但可能,在今天来说已经不再是“新”东西了。苏联科学院在1955年底便利用高速电子计算机进行了翻译外国科学文件的试验。

用电子计算机的原理自动翻译语言文字的办法,是先把要翻译的文字编成数码符号,然后好像做数字运算一样地用电子计算机进行翻译。

电子计算机的动作速度是很大的,每秒钟可以动作几千次。虽然如此,由于每个国家的语言文字都极其复杂,机器的构造就非常复杂。

因此目前的翻译机器,还只能用来翻译科学文件,因为科学文件上所用字汇有限,一般地说,每个专业只要有1000个通用字和1000个专门字就差不多够用了。所以机器可以简化。

此外,将翻译的范围限制在翻译科学文件上,译文上的修辞和风格问题等,就也跟着简化了。

翻译一种外国语言,需要有外国语法的知识、字典和本国语言法的知识。有了外国语言句法的知识,就可以决定一个外国字的文法调类和这些字在句子中的地位。有了本国语言句法的知识,就可以把翻译过来的外国字按照本国语言的顺序重新安排并加上语气中应有的字尾或字。

人在翻译工作中所需要做的大部分工作,都可以用机器自动做,例如先阅读文件、查字典、解决语法问题、差不多都能用适当的方法在做数字计算的电子计算机内完成。

用机器进行翻译的程序

自动化翻译的程序,虽然在电子计算机中是很复杂的,但归纳起来可成为两大步。第一步是外国文句的分析,将外国文句中的每个词,根据原句的排列构造,再按自动字典中储藏的语法特征决定相应的本国语法形式和它在译文句中应排列的位置,并且把结果用数码表示出来。

翻译程序的第二步是按照上列的分析,进行复杂的“查字典”工作,把外国词给以本国词的相当意义。这个手续中包含两件事,第一是加正确的字尾,根据本国语言的规则加字尾是很简单的。第二是按照本国语的文字次序来重新安排。这些动作都由电子计算机按预先设计好的适合于语法要求的计算程序,用惊人的高速度自动操作。

图1
图1 🔍原图 (1542×1023)

电子计算机作翻译工作的基本动作,可以归纳成:(1)进入的词与字典的记录相比较;(2)弄清词的用法;(3)由储存处出来或到储存处去的控制。以英文翻译成俄文为例,它的程序是:放入英文文件,分解英文文句,组合成俄文文句,印出俄文文件。

会做翻译工作的机器由那些部分构成的?

作翻译用的电子计算机,就是一般作数字运算的高速电子计算机,构造相当复杂,要用几千个电子管。但不管它怎么复杂,总脱不掉五个基本设备:(1)进入设备,以便使被译文字进入机器;(2)记忆设备,以便将外国文字和本国文字储存在上面;(3)控制设备,以便控制选字工作;(4)算术运算设备,以便进行“运算”如加减等;(5)输出设备,以便将译好的文件印出来。

在自动翻译中用来演算的数字以及所得的中间结果都记录在记忆器中,运算按一定的指令进行,这些指令是按翻译的要求制定的。

进行翻译时并不是将文件直接送入机器,而是将外国文的字先变成字码,而电子计算机的运算是用二元法(或称二进位制),即“0”或“1”,因此进入设备便可以用凿孔机,按下每个字母键,便在纸条上出现“0”和“1”。将凿好孔的纸条送入机器,纸条上的孔(相当于“1”)便变成相应的电流脉冲时间,空白(相当于“0”)便变成相应的空白时间,以便适合计算机用。译好的文件从机器输出处出来,与此相反,是先送出电流脉冲和空白脉冲等,然后再由这些脉冲控制电传打字机印出字来。

自动字典

图2
图2 🔍原图 (1173×980)

电子计算机作自动翻译工作最重要的一个部分是“自动字典”,实际就是计算机的记忆设备。用作内部运算记忆的有阴极射线管记忆器,作记忆外文字典的一般是用磁鼓,磁鼓的一边储存着外国字的字典,另一边储存着相当字义的本国字的字典,这两种字典并不是真正的一本一本的字典,而是将本国字和外国字都先译成数码,按号码编成一组组的电流脉冲。这些数码事先用磁化的方法储存在磁鼓上。所谓“记忆”也就是磁鼓上按要记的号码留下剩磁,它的记录与读出和钢丝录音机的录音放音相同。一个磁鼓上可以储存8000个字,译文学作品需要好些磁鼓,而译科学文件,只有一个磁鼓就够了。

翻译是靠“算术”来进行的

图3
图3 🔍原图 (1584×1156)

在自动翻译的过程里,翻译工作是靠“算术”运算来进行的。算术运算的作用是使进入的字与储存在磁鼓上的字相比较,磁鼓上的字能够按顺序放出来与进入的字相减(因为实际上字在计算机内都已变成了数码),若相减的结果是零,那么进入的字便刚好与被减的字相重合。重合时便有个信号出来起动翻译程序里的下一步,在最简单的情况下,这下一步就是从磁鼓上的字典里挑出适合的本国字。这个动作实际上是利用一种“加法电路”来完成的,以上所讲的相减实际上是利用一组组的脉冲相加代替的。算术部分的另一作用是把“字尾”和“字干”分开来(减)或把它们合起来(加)。当所翻的文字是很复杂的文字时,这个作用特别有用(有些文字如拉丁字最好是分成字干和字尾,这情况中国字是没有的)。对于这种文字最好是把字干和字尾分别储存在磁鼓上。

专业字典

翻译工作若只限于科学专业文件,机器设备可以大大简化。用字种类的数量少,而集中在技术文字上,减少了许多含糊不明的困难。

作专业翻译,磁鼓上所储存当然就是一部专业的字典,例如说无线电技术吧,必须从两方面进行编集,第一是搜集无线电技术上使用的一般语言;第二再搜集所有无线电事业的专用语汇。翻译技术文件,就要先把无线电技术中一般通用的字和专门理论中所特有的字储存在计算机的磁鼓上。(羽)