语音阅读 让眼睛彻底解放
软件强档
语音技术的发展
有人预言:“未来的十年是语音技术的时代”!在不久的将来,人的声音是软件与任何硬件间最自然的用户交互方式。聊天、电子邮件、网上浏览等活动将受语音驱动。计算机将具有真人一样的声音。据专家对未来国内市场预测,五年内,整个中文语音市场份额将至少在1000亿元人民币以上。
很多年前就有人开始研究语音技术了,但真正能够将文字变成声音的语音合成技术还是伴随着计算机技术的发展而发展起来的。主要经历了三个阶段:
1.频谱参数合成方法
这种方法最具代表性的就是1987年美国DEC公司的DECtalk系统。DECtalk采用“串/并联共振峰合成器”,它发音清晰,可产生七种不同音色的声音,但整体合成语音的音质难以达到实用要求。
共振峰合成:音色各异的语音具有不同的共振峰模式,因此,以每个共振峰频率及其带宽作为参数,可以构成共振峰滤波器。再用若干个这种滤波器的组合来模拟声道的传输特性(频率响应),对激励源发出的信号进行调制,再经过辐射模型就可以得到合成语音。
2.波形拼接法
1990年,LPC参数(Linear Predict Coding,线性预估编码)合成技术和PSOLA技术(Pitch-Synchronous Overlap Add,基音同步叠加),使得语音的音色和自然度明显提高。
3.串接法
90年代末期,语音技术又有新的突破,这种方法是基于语音数据库的语音合成,合成语句的语音单元是从一个预先录下的庞大的语音数据库中挑选出来的。这样的方法使用之后,语音自然度有了很大提高,逐步达到实用化了。目前比较突出的语音阅读软件几乎都是采用这样的方法。但这种语音库的办法也使得软件体积非常大,使它要运用到手机、PDA等设备上有些困难。
语音阅读软件推荐
现在的语音阅读软件非常多,这些软件的效果差异也比较大,主要差别在于阅读声音的速度要符合真人阅读的效果,抑扬顿挫,越真实越好。下面我们就推荐几款优秀的软件供大家参考。
播音王2004
软件信息:187.1MB/演示版
下载地址:http://www.xn163.com/SoftDown.asp?ID=794&lbID=0
简介:庞大的语音数据库,女声抑扬顿挫的变音比较突出。发音自然度比较高。并且带有语音合成系统,可以直接将文字转换成声音文件。同时具有语音闹钟、及时校对等功能。而且是免费的演示版本。缺点:不能阅读英文。
听网1.0
软件信息:61.8MB/注册版
下载地址:ftp://xylxdown:xylxdown@61.128.235.19/soft/tw1.0.exe
简介:和播音王出自同一个公司,界面和操作与播音王相似。采用KD2000语音库。语音质量稍逊于播音王2004。具有中英双语朗读功能,英文朗读采用微软的TTS,同时它也具有阅读网页文件,体积比较小的优势。
新华音霸2004
软件信息:217MB/注册版
下载地址:http://www.xn163.com/SoftDown.asp?ID=800&lbID=0
简介:自带独立语音库(英文部分使用微软TTS),语音没有音调调节的功能,变调不明显。自然度没有前面两个软件的高。
捷通听霸3000
软件信息:80MB/免费
下载地址:http://www.xn163.com/SoftDown.asp?ID=796&lbID=0
简介:可以选择男女发音,主要是声音自然度还是不及前面几个软件,听起来还是比较生硬。除了语音朗读,还可以定制卡通人物界面,语音闹钟、整点报时、检查新邮件,并且会通知你。
播音王语音阅读实战
“播音王”自带超过200MB的真人语音库,采用了先进的韵律分析技术。它在朗读时抑扬顿挫,音调已经接近自然。和同类软件比较,“播音王”有语音音调调节的功能,逼真的程度更接近人声。
三步学会语音阅读
运行后就会发现程序界面像个影音播放器,各个功能按钮也相近。当你的鼠标指向某个按钮时就会看到它的功能说明(图1)。

1.系统设置
为了获得更好的朗读效果,建议在使用之前对播音王进行一下设置。用鼠标右键点击程序窗口左上角选择“系统设置”后,点击“朗读标签”,调节一下朗读的速度。默认的速度有点慢,建议这里设置为20。再点击“用户偏好设置”选择你准备阅读的文档相适应的类型(不要全部选上,否则就没有意义了。建议只选一个)。确定后就可以开始为你阅读文档了(图2)。

2.及时校对与文档朗读
运行软件后,当你再输入文字时,程序会把每一个输入的文字朗读出来,起到一个校对的作用。
这个版本的播音王支持的朗读文件格式有txt和htm两种。你可以将这两种格式的文档或者含有这类文档的文件夹直接拖入播放窗口。播音王就会自动开始朗读拖入的文件里的文字。这个时候,你就可以沏杯茶坐到一边慢慢欣赏,或者躺在床上闭目聆听。
要注意的是,在阅读中如果你还想进行其它操作的话,就要关闭“及时校对”功能,否则,当你输入字符时就会停止阅读。关闭“及时校对”也比较简单,点击窗口上的“显示隐藏窗口按钮”去掉“及时校对”前的钩即可。
3.下载阅读
播音王不仅可以播放本地文档,对于网页文件同样可以下载朗读。使用方法也很简单,就是在按“打开URL、本地目录或文件”按钮后输入要阅读的网页地址。不过,笔者并不推荐大家这样做,因为有些htm格式文档的一些符号等无关内容也会被读出来,推荐将需要朗读的文本编辑为txt文件后进行朗读。从我的使用经验来看,并不是所有的东西都适合语音朗读。比如,那些需要细细品味的文章和情节;偶尔还得掩卷而思的教材和论著。但用它给你读小说之类那是完全没有问题的。
语音合成自己动手
1.让电脑发音更真实
“InterPhonic语音合成系统”就是安装时要先安装的部分,播音王就是使用的它的语音库。语音合成不仅要求能够通过机器将文字转成声音,还有一个很重要的指标就是合成出来的声音是否能像真人发音具有一定的感情。这就是语音合成里面的韵律分析技术。由于这里面要涉及到语言学、社会学、心理学、人工智能等诸多因素,因此也决定了不同的语音合成产品之间合成的效果会有很大差异。目前,已经有一些第三方软件开始使用“InterPhonic语音合成系统”来作为自己的语音库。
2.把文本变音频
如果你想把文本直接转变成音频文件,就不用录音机之类的来录音了。这个合成系统可以直接将文本转变成音频文件。
在桌面,你会找不到“InterPhonic语音合成系统”的快捷方式,点击“开始→程序→科大讯飞→InterPhonic语音合成系统”,就可以打开它了。然后打开或者在右边窗口输入需要转换成声音的文本(图3)。点击播放就可以听到文本的内容了。

默认的设置总是有些不太令人满意,笔者在使用过程中就发现,“合成风格”设置为“抑扬顿挫”会更自然一些。默认的“朗读的音量”也有些低,你可以根据需要适当增加一些,推荐调节到5。在“高级设置”选项里,可以根据需要设置标点、分句、回车、数字的读法(图4)。

设置好后按“播放”听一下,满意后就可以选择“导出”按钮,就可以把刚才的文本保存为WAV格式的音频文件。一篇文字就这样神奇地变成声音了。现在就闭上眼睛听听吧!
3.语音闹钟提醒
很多软件有闹钟功能,但是能够多次设置闹钟提醒时间的软件不多。播音王的闹钟功能就可以设置多次提醒时间,而且是语音和窗口同时提醒。你填什么内容就会用什么声音提醒你。
打开播音王,在“小秘书”按钮下选“语音闹钟管理”,在弹出的窗口选中“添加”,出现“添加闹钟”面板(图5)。选择要提醒的时间,提醒的方式可以是输入文本,到时候就会用合成的语音提醒你(图6)。当然,也可以选中要执行的命令或者已经有的声音文件。


几点不足:
在使用本软件的过程中,我们也发现了“播音王”的一些不足。首先,它不会读英文,单词都是一个字母一个字母地念。第二,特殊符号处理能力不强,直接影响了网页文件的阅读效果。第三,部分词语的朗读还比较生硬,变调不合理。