学位论文 > 优秀研究生学位论文题录展示

基于句法特征的汉语韵律边界预测的研究

作 者: 朱玲
导 师: 杨鸿武
学 校: 西北师范大学
专 业: 电路与系统
关键词: 韵律边界 语法结构 句法结构 韵律词 韵律短语 邻接度 TBL算法 自然语言处理技术平台LTP
分类号: TN912.3
类 型: 硕士论文
年 份: 2013年
下 载: 20次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着科学与技术的发展,高自然度的语音合成成了人工智能、语音信号处理以及人机交互领域一个重要的研究课题。现阶段的语音合成技术研究重点是实现汉语文语转换系统(CTTS),将输入的文本按语音处理规则自动地转换为声学信号输出。为了更准确预测出输入文本的韵律边界信息,提高输出语音的自然度,本文建立了文本语料库,统计分析了语法特征、句法特征和韵律结构的关系,对比分析了词性、词长和邻接度等各个参数对韵律边界预测的影响,最终利用TBL算法来实现对汉语韵律边界的预测。论文的研究结果对于揭示文本与语音之间的关系、提高合成语音的自然度具有重要的理论意义和应用价值。论文的主要研究成果和创新如下:1.设计并建立了一个含句法信息的大规模的汉语文本语料库。本文利用面向web基于XML的中文信息处理平台——语言技术平台LTP,对句子进行句法结构拆分;语料信息标注结果均通过了专家的抽样检查,达到了科研要求,可用于韵律边界的预测。该语料库包含约10000句标准语法的汉语文本语料,平均句长为52字。2.统计分析了语法特征、句法特征和韵律结构的关系,提出了一个用于汉语韵律边界预测的新特征——邻接度。对文本信息的统计分析表明:文本语料中语法词在该句子中的句法层级和韵律结构有很大的相关性。本文提出用邻接度(Adjacent Degree,AD)这一概念来描述文本语料中语法词在该句子中的句法层级,并将它作为新的韵律结构的预测参数,反映句法结构和韵律结构的关系。因此,标注汉语语料时追加了邻接度这一反映句法特征的信息。3.提出将词性、词长和邻接度等特征作为韵律预测的参数,并对比分析了词性、词长和邻接度等特征对韵律边界预测的影响。本文对汉语语料库的文本信息进行了统计分析,根据分析结果选用了词性、词长和邻接度等特征作为韵律边界预测的重要参数。4.提出了一种能有效预测韵律边界的统计学习算法——TBL算法。TBL算法是一种基于转换的错误驱动学习算法,它能在人工规则模板不适用时自动地从实例中学习新规则,并将新规则添加到已有的规则模板中。实验结果表明,该方法在测试集上韵律词的预测精度达到了98.4%,韵律短语的预测精度达到了82.7%,均优于现有的同类研究结果。

全文目录


摘要  6-7
Abstract  7-9
目录  9-12
第1章 引言  12-21
  1.1 研究背景及意义  12-16
    1.1.1 研究背景  12-15
    1.1.2 研究意义  15-16
  1.2 韵律边界预测的研究现状  16-18
    1.2.1 韵律预测的研究现状  16-17
    1.2.2 汉语韵律边界的研究现状  17-18
  1.3 本文工作介绍  18-20
  1.4 论文内容安排  20-21
第2章 研究基础  21-40
  2.1 文-语转换语音合成系统  21-25
    2.1.1 文本分析  21-23
    2.1.2 韵律生成  23-24
    2.1.3 语音生成  24-25
  2.2 汉语韵律结构的研究  25-28
    2.2.1 汉语的韵律特征  26
    2.2.2 汉语的韵律结构  26-28
  2.3 汉语韵律结构与语法结构  28-33
    2.3.1 汉语的语法特征的研究成果  29-31
      2.3.1.1 韵律结构与词性的关系  29
      2.3.1.2 韵律结构和词长的关系  29-31
    2.3.2 韵律结构与语法结构的相互关系  31-32
    2.3.3 韵律结构和语法结构相互关系的研究现状  32-33
  2.4 汉语韵律结构与句法结构研究  33-34
    2.4.1 韵律的句法特征的研究成果  33
    2.4.2 韵律结构与句法结构相互关系  33-34
    2.4.3 韵律结构与句法结构相互关系的研究现状  34
  2.5 句法分析  34-39
    2.5.1 汉语自动分词及词性标注  35-38
      2.5.1.1 自动分词方法  35-36
      2.5.1.2 自动分词的算法  36
      2.5.1.3 词性标注  36-38
    2.5.2 基于规则表示的句法分析  38
    2.5.3 基于统计方法的句法分析  38-39
  2.6 讨论与小结  39-40
第3章 汉语语料库的构建  40-48
  3.1 文本语料的准备  40-41
  3.2 制定语料标注的规范  41-42
  3.3 按规范标注语料  42-45
    3.3.1 标注流程  42
    3.3.2 标注工具  42-45
    3.3.3 标注经验  45
  3.4 标注评价函数及评测结果  45-46
  3.5 讨论与小结  46-48
第4章 基于语法特征和句法特征的汉语韵律边界预测  48-67
  4.1 语法特征与韵律结构的相互关系  48-55
    4.1.1 语法特征和韵律词的相互关系  49
    4.1.2 语法特征和韵律短语的相互关系  49
    4.1.3 统计分析结果  49-55
      4.1.3.1 语法词词性特征和韵律特征的统计结果  49-53
      4.1.3.2 语法词词长特征和韵律特征的关系  53-55
  4.2 句法特征与韵律结构的相互关系  55-57
    4.2.1 邻接度和韵律结构的相互关系  55
    4.2.2 统计分析结果  55-57
  4.3 韵律词和韵律短语的预测  57-66
    4.3.1 算法介绍  57-59
    4.3.2 实验介绍  59-63
    4.3.3 实验特征选择  63
    4.3.4 实验结果分析  63-66
  4.4 讨论与小结  66-67
第5章 总结与展望  67-68
  5.1 工作总结  67
  5.2 工作展望  67-68
参考文献  68-72
攻读硕士期间发表的学术论文与主要成果  72-73
致谢  73

相似论文

  1. 红安方言语法研究,H146
  2. 面向双语平行语料库的英藏句子结构研究,H214
  3. 基于特征的中文名词性谓词语义角色标注研究,TP391.1
  4. 汉、韩语肢体词语意义泛化现象比较研究,H55
  5. 生物医学文献中模糊限制语及其范围的检测,TP391.1
  6. 《韩非子》句法研究,H141
  7. 现代汉语“为”字句的多角度考察,H146
  8. 《晏子春秋》述宾结构研究,H141
  9. “如果”句的语篇分析,H146
  10. 现代汉语句法和语义不对称现象考察,H146
  11. 高表现力语音声学建模的研究,TN912.3
  12. 中韩身体部位惯用语比较研究,H136
  13. 数量短语对语法结构的制约作用,H146
  14. 中古汉语连动式研究,H141
  15. 汉语非短语结构的词汇化研究,H146
  16. 高级阶段留学生“得”字情态补语句的习得考察,H195
  17. 《三遂平妖传》语气副词研究,H141
  18. 不定式句法结构反思,H314
  19. 现代汉语“V到P”结构的系统属性及其历史来源,H146
  20. 新加坡电影《小孩不笨2》中的语码转换分析,H03
  21. 语言理解过程对口译可行性的影响,H059

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com