语音的编辑合成
汉语的有调音节共1282个,从理论上讲,有了这些音节就可以合成任何文章了。但由这些单音节编辑合成的语音自然度不够好,其原因是,在连续语流中,相邻语音的发音互相影响,状态发生了变化。如上声相连时前面的上声近似读阳平(如“友好”)、重叠名词的后一音节读轻声(如“爸爸”)、词尾儿化(“上坎儿”)等。还有多音字问题,如“行走”、“银行”。因此,为建立一个无限词汇的合成系统,除要建立音节语音数据库外,还要建立韵律规则、音变规则、多音字发音等知识库。待语音输出时,利用这些知识,把汉字文本,转换成一系列语流控制参数,再从语音数据库中取出语音数据,最后经模数转换,输出自然流畅的语声。实际上这已经是一个高级的语音合成系统,即文字---语音转换系统了。
上述的语音输出系统,为存储语音数据需要较大的存储容量,如何解决这个问题呢?关键是语音压缩编码。