学位论文 > 优秀研究生学位论文题录展示

基于二元语义标注的波形拼接语音合成

作 者: 林磊
导 师: 万建成
学 校: 山东大学
专 业: 计算机软件与理论
关键词: 语音合成 TTS 韵律标注 PSOLA 语音库
分类号: TP391.42
类 型: 硕士论文
年 份: 2005年
下 载: 122次
引 用: 1次
阅 读: 论文下载
 

内容摘要


语音合成(TTS,Text To Speech)技术是将计算机自己产生的或外部输入的文字信息,比如文本文件内容、WORD文件内容等文字信息,按语音处理规则转换成语音信号输出,即使计算机流利地读出文字信息,使人们通过“听”就可以明白信息的内容。随着计算机技术和通讯技术的巨大发展,TTS技术已经应用到语音对话系统、语音呼叫中心、语音触发的网站和电子邮件服务等很多领域并且已经发挥出其巨大的威力,但是,当前现有的TTS系统在自然度和可懂度方面都离人们的要求相差甚远,真正能够代替人来阅读的TTS系统还没有出现,从而也制约着TTS系统在更大的范围内的使用。 在语音合成方面,首先遇到的困难是从文本信息到韵律的标识上,自然语言中,语音特征变化万千,其数据本身隐含了知识。而对这些知识,人类可以感知,但对其的认识、描述是远远不够的。在从文字到韵律符号描述的自动转换方面,对自然语音理解能力的不足一直是研究工作的瓶颈所在。目前文字到韵律描述的转换通常只能根据一些基本的语法信息(如词性)来划分语调短语或设置语句的普通重音,还没有根据句子的语义来做深层次处理(如设置不同的表达或感情色彩)的能力。其次,从声学的层面上,人们对韵律特征对应的声学参数还没有完全认识,缺乏完备的描述,只能凭经验。这也进一步阻碍了将文本标注的韵律信息表现出来,生成自然的带有韵律感和重音感的合成语音。 本文借助我们实验室以往对自然语言理解处理的成果——二元语义关系分析。建立了一套符合XML扩展标记语言标准的文本语音合成描述符号体系,同时建立了从语义描述标注到语音合成韵律标注的转换规则,将对语义的描述自动转换到语音韵律信息的描述。而且,还考虑到了文本中的多音字、数字、符号、字母的发音问题,建立了一系列针对这些情况的发音描述方式。 在韵律语音的合成上,本文搜集了1248个汉语中的单字和8000多个使用频率较高的双字词、三字词、四字词以及常用人名、地名等语料信息,对其进行整理编号后,在转门为本系统开发的语音库维护程序上对这些语料进行了人工录音,对这些语音资料切分和基音周期分析后,存入语音数据库和检索索引数据库,构建了本系统所需要的基础语音数据。 语音合成模块包含语速修改单元、语气修改单元、重音修改单元以及静音生成单元等,并且把它们做成模块的形式,提供接口供语音合成模块调用以改变语

全文目录


摘要  6-8
ABSTRACT  8-10
1 引言  10-18
  1.1 课题的研究背景及意义  10-11
  1.2 语音合成的发展现状  11-16
    1.2.1 国内外语音合成的发展状况  11-13
    1.2.2 语音合成中的语音标注和韵律  13-14
    1.2.3 基本语音合成理论  14-15
    1.2.4 一个完整的语音合成系统的构成  15-16
  1.3 语音合成中遇到的难题  16-17
  1.4 课题的研究方案的确定  17-18
2 二元语义标注到语音合成标注的映射模型  18-30
  2.1 二元语义关系分析  18-21
    2.1.1 什么是二元语义分析  18-20
    2.1.2 二元语义关系分析结果的标注形式  20-21
  2.2 语音合成标注  21-24
    2.2.1 语音合成标注中标记符号的位置  21-22
    2.2.2 本系统所用的标注符号  22-24
  2.3 文本标注中的多音字和非汉字读音的确定  24-25
    2.3.1 多音字读音的确定方法  24
    2.3.2 文本中的数字读音的确定方法  24-25
    2.3.3 文本中的字母和符号读音的确定方法  25
  2.4 由二元语义分析标注到语音合成标准的映射  25-30
    2.4.1 映射规则  26-28
    2.4.2 实现步骤  28-29
    2.4.3 存在的问题  29-30
3 标注文本到韵律语音的合成  30-45
  3.1 语音合成的基本理论讨论  30-32
    3.1.1 共振峰合成  30-31
    3.1.2 LPC参数合成  31-32
    3.1.3 PSOLA合成技术  32
  3.2 波形拼接语音合成和PSOLA算法  32-35
  3.3 韵律建模  35-36
  3.4 标注文本的解析  36-37
  3.5 语音库的建设  37-43
    3.5.1 语音库语料的选择  37-39
    3.5.2 基音标注  39-41
    3.5.3 语音库语音单元的生成和标注  41
    3.5.4 语音库结构设计  41-43
  3.6 由标注文本控制合成韵律语音  43-44
  3.7 语音合成中提高合成速度的方式  44-45
    3.7.1 在检索方式上  44-45
    3.7.2 在合成方式上  45
4 汉语语音合成系统的进一步讨论  45-46
5 语音合成及语音库维护实验平台介绍  46-47
  5.1 语音库维护平台  46-47
  5.2 语音标注与合成平台  47
6 合成测试  47-48
7 总结  48-49
参考文献  49-52
致谢  52-53
攻读学位期间所发表的学术论文  53-54

相似论文

  1. 声道频响合成方法在军队姓名语音库的应用,TN912.3
  2. 移动音视频交互业务执行平台的研究,TN915.09
  3. 仿真机器人控制系统,TP242
  4. 基于自动切分的PSOLA语音合成在大坝监控系统中的应用研究,TP277
  5. Ant在IVR系统测试的应用,TP311.52
  6. 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
  7. 语音库自动构建技术的研究,TN912.33
  8. 基于CTI技术的小型呼叫中心的研究与实现,TN99
  9. 基于多层架构模型设计的呼叫中心设计及实现,TN99
  10. 基于支持向量机的说话人识别系统的开发,TN912.34
  11. 基于HMM的可训练越南语语音合成系统,TN912.33
  12. 语音变调算法研究及其在语音合成中的应用,TN912.33
  13. 汉语语文转换中NHMM算法和音库词库设计的研究,TN912.3
  14. 基于嵌入式技术的射频识别信息终端研究开发,TP368.12
  15. 基于GSM网络具有语音合成功能系统的设计与实现,TN912.33
  16. 基于G.729标准的拼音合成算法及其DSP实现,TN912.3
  17. 应用四环素调控系统建立可诱导的真核表达体系,Q78
  18. 基于移动终端的旅游信息推送服务系统关键技术研究,TN929.53
  19. 跨文化的情感语音分析,TP391.42
  20. 基于情感基音模板的情感语音合成,TN912.33
  21. 面向气象语音呼叫中心的语音合成软件设计与实现,TN912.33

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 声音识别及其装置
© 2012 www.xueweilunwen.com