学位论文 > 优秀研究生学位论文题录展示

语料库支持的英语文语转换合成引擎

作 者: 倪昕
导 师: 蔡莲红
学 校: 清华大学
专 业: 计算机科学与技术
关键词: 文语转换 协同发音 语音语料库 基元选取 多语种合成
分类号: TP391.1
类 型: 硕士论文
年 份: 2004年
下 载: 151次
引 用: 2次
阅 读: 论文下载
 

内容摘要


随着国际交流的日益深入,英语作为国际语言已经深入到我们的生活当中。人们对于中、英文混杂的文本已经并不陌生。这在客观上要求文语转换系统适应双语甚至多语种需求,实现同一说话人的双语合成。完成这一任务的关键是建立适应非母语说话人的合成引擎。合成引擎完成从音标到实际语音的转换。它包括基元选取、韵律修改、语音语料库等几个部分。合成引擎不但直接控制合成音质和韵律自然度,也反映了说话人个性特征。它与合成效果直接相关,在功能上是合成系统的核心。本文围绕英语合成引擎,研究了英语协同发音规律、语音语料库优化、基于混合基元的基元选取算法和多语种适应问题。主要研究工作和成果如下:从拼接自然度和频谱连续性出发,以听觉感知为最终标准,研究了英语语音协同发音现象,提出了音位定界规则,在“拼接辅音”和“拼接元音”概念的基础之上确定了基于语料库英语合成系统中的拼接基元。为适应非母语说话人特点,提出了多层次、低冗余的语料库设计方法;在录音控制、切分标注等方面进行了大量细致的优化工作,有效地提高了引擎的合成效果;提出了开放的语料库体系结构,并在语音研究中得到了初步应用。提出了基于混合基元的非定长基元选取算法,以协同发音规律为理论依据,以语料库为基础,将音位定界规则转化为拼接规则并和非定长基元选取算法结合在一起,在基元选取过程中依据全局代价动态确定、生成拼接基元;优化了韵律修改算法;提出了快速数据库架构。研究了合成引擎的多语种适应问题,提出了适应多种合成基元、可定制特征集和度量方法、共享基元选取和韵律修改算法、统一表示语言结构的多语种引擎,并在中、英双语上得到初步实现。

全文目录


中文摘要  2-3
Abstract  3-5
目录  5-8
第1章 引言  8-20
  1.1 研究目的和意义  8-9
  1.2 国内外研究现状  9-18
    1.2.1 英文TTS引擎研究现状  9-10
    1.2.2 基元模型与协同发音研究  10-12
    1.2.3 合成语音语料库  12-14
    1.2.4 基元选取算法  14-17
    1.2.5 韵律修改算法  17-18
  1.3 论文工作介绍和内容安排  18-20
第2章 面向拼接合成的英语协同发音研究  20-56
  2.1 协同发音的一般问题  20-22
  2.2 传统研究面临的挑战  22-26
  2.3 实验设计  26-28
  2.4 第一类:C-V和V-C音联  28-49
    2.4.1 清摩擦音-元音、元音-清摩擦音  28-33
    2.4.2 浊擦音-元音、元音-浊擦音  33-37
    2.4.3 送气塞音-元音、元音-送气塞音  37-40
    2.4.4 不送气塞音-元音、元音-不送气塞音  40-42
    2.4.5 塞擦音-元音、元音-塞擦音  42
    2.4.6 鼻音-元音、元音-鼻音  42-46
    2.4.7 流音-元音、元音-流音  46-48
    2.4.8 滑音-元音、元音-滑音  48-49
  2.5 第二类:C-C音联  49-52
    2.5.1 辅音簇:/tr/、/dr/、/ts/和/ds/  49-50
    2.5.2 辅音簇:塞音-流音  50-51
    2.5.3 词尾塞音-词头塞音音联  51
    2.5.4 辅音簇:/s/-送气塞音  51-52
    2.5.5 同部位发音的鼻音-不送气塞音音联  52
  2.6 第三类:V-V音联  52-53
  2.7 音位定界规则  53
  2.8 合成基元  53-54
  2.9 本章小结  54-56
第3章 英语合成语音语料库的优化  56-74
  3.1 语音语料库概述  56-57
  3.2 语音语料库的设计  57-66
    3.2.1 语音合成语料库的设计需求  57-58
    3.2.2 语料的来源和篇章筛选  58-59
    3.2.3 贪婪选择算法  59-61
    3.2.4 多层次、低冗余的语料选取  61-65
    3.2.5 数据统计和比较  65-66
  3.3 语音语料库的构建  66-71
    3.3.1 录音  66-68
    3.3.2 自动基音周期标注  68-69
    3.3.3 音位切分  69-71
    3.3.4 自动韵律标注  71
    3.3.5 其它声学参数的收集  71
  3.4 语音语料库的体系结构  71-73
  3.5 本章小结  73-74
第4章 基于混合基元模型的合成算法  74-90
  4.1 合成系统后端概述  74-75
  4.2 混合基元模型和拼接规则  75-78
  4.3 非定长基元选取  78-84
    4.3.1 使用上下文索引树预选取  78-79
    4.3.2 音位特征向量与代价度量  79-81
    4.3.3 代价度量函数  81-82
    4.3.4 基元生成与归并  82-84
  4.4 韵律修改和拼接平滑  84-85
  4.5 快速基元数据库  85-86
  4.6 评测  86-88
  4.7 本章小结  88-90
第5章 合成引擎的多语种适应  90-100
  5.1 多语种适应的合成后端概述  90-92
  5.2 不定基元和多语种音库  92-94
  5.3 特征和度量函数库  94-95
  5.4 共享选音算法和韵律修改算法  95-97
  5.5 语言结构的统一表示  97-98
  5.6 语言配置  98-99
  5.7 本章小结  99-100
第6章 总结和展望  100-102
参考文献  102-106
致 谢  106
声 明  106-107
本人简历  107
在学期间的研究成果及发表的学术论文  107

相似论文

  1. 基于Windows CE的监室管理系统设计与开发,TP311.52
  2. 基于SOM网络的语音基频模式提取研究,TN912.3
  3. 汉语连续语音的音节自动标注算法研究及实现,TN912.34
  4. 基于Web文语转换通讯系统的设计与实现,TP311.52
  5. 汉语双音节词语VCV序列双向协同发音研究,H102
  6. 中文话费文语转换系统的研究与实现,TN912.3
  7. 基于汉语驱动人脸语音动画的研究,TP391.41
  8. 潮汕方言文语转换系统的研究与实现,TP391.1
  9. 汉语普通话基频模式研究,TN912.33
  10. 吴语文语转换中语音合成与韵律控制的研究,TN912.3
  11. 基于MPEG-4标准的三维人脸动画,TP391.41
  12. 一种改进的语音合成方法,TN912.3
  13. 汉语普通话辅音发音部位:基于EPG的研究,H116
  14. 基于大语料库英文TTS语音拼接单元的选择,TN912.35
  15. 文语转换系统若干问题研究,TN912.3
  16. 基于不定长拼接单元的维吾尔语文语转换系统的研究与实现,TP391.1
  17. An Optimality Theoretic Analysis of Tone and Tone Sandhi in Xiangtan Dialect,H174
  18. An Optimality Theoretic Analysis of Tones and Tone Sandhi in Taiyuan Dialect,H172.2
  19. 数据挖掘在语音合成中的应用,TP391.42
  20. 汉语语音合成韵律控制方法与实现的研究,TN912.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com