学位论文 > 优秀研究生学位论文题录展示

综合短时特征和长时特征的发音质量评价方法研究

作 者: 苏静
导 师: 裴明涛;张文耀
学 校: 北京理工大学
专 业: 生物医学工程
关键词: 发音质量评价 语音建模 声学特征 韵律特征 感知特征
分类号: TN912.3
类 型: 硕士论文
年 份: 2010年
下 载: 72次
引 用: 0次
阅 读: 论文下载
 

内容摘要


发音质量评价在计算机辅助言语康复和语言教学中有着重要的应用价值。目前,国内外大多数发音质量评价研究都是建立在语音识别的基础上,但是基于语音识别的发音质量评价与专家主观评价的相关性比较低。为此,本文采用非语音识别的方法,提取测试语音和参考语音的短时特征和长时特征,通过比较他们的特征差异来评价发音质量。本文的主要工作和内容如下:1.提出了一种综合短时特征和长时特征的发音质量评价方案。短时特征是以一帧语音信号为单位提取语音特征,本文选用了共振峰频率、基音频率、短时能量、段长、Bark谱、MFCC谱、MFSC谱、HBSCC谱等特征参数;长时特征是基于语段(由多个语音帧组成)对参考语音和测试语音的特征包络提取相应的特征参数,体现了语音的长时变化规律,本文主要选取了峰谷点个数、均值、语段波形上升率、语段波形下降率等特征参数。本文的发音质量评价综合短时特征和长时特征,分别从声学、韵律和感知三个方面对语音进行建模,并计算参考语音和测试语音的模型相似性;然后通过BP网络将模型的相似性映射为客观评分。2.分别研究了基于声学特征韵律特征感知特征的发音质量评价方法,通过实验对比分析了声学特征、韵律特征和感知特征在发音质量评价中的不同作用。3.在韵律特征的选择与分析中,提出了一种融合基音频率、能量和段长特征的韵律模型,将其应用到发音质量评价中。4.在感知特征分析方面,通过实验分析比较了Bark谱、MFCC谱、MFSC谱和HBSCC谱等感知特征参数在发音质量评价中的作用;根据实验结果选取相关性最大的感知特征参数MFSC谱建立了感知模型,并将其应用于本文的发音质量评价方案中。5.通过BP神经网络,将声学、韵律和感知三方面的模型相似性融合映射为最终的客观评分,并对这一客观评分与主观评分的相关性进行了实验分析,给出了相关的实验结果。最后,针对上述研究工作和内容,设计实现了一个原型实验测试系统。实验测试结果表明,本文的发音质量评价方法,能够明显提高客观评价和主观评价的相关性。

全文目录


摘要  4-5
Abstract  5-10
第1章 绪论  10-18
  1.1 课题背景及研究意义  10-11
    1.1.1 课题背景  10-11
    1.1.2 研究意义  11
  1.2 发音质量评价过程  11-12
    1.2.1 主观评价过程  11-12
    1.2.2 客观评价过程  12
  1.3 发音质量评价的研究现状  12-15
    1.3.1 国外发音质量评价的研究现状  12-13
    1.3.2 国内发音质量评价的研究现状  13-15
  1.4 本文内容  15-18
    1.4.1 研究思路  15-16
    1.4.2 内容安排  16-18
第2章 发音质量评价总体方案  18-32
  2.1 评价方案  18-27
    2.1.1 预处理  19-22
    2.1.2 语音建模  22-24
    2.1.3 相似性计算  24-26
    2.1.4 语音评分  26-27
  2.2 实验数据  27-30
    2.2.1 数据采集  27-28
    2.2.2 主观评分  28-29
    2.2.3 数据分配  29-30
  2.3 实验方案  30-32
    2.3.1 客观评分  30
    2.3.2 相关性分析  30-32
第3章 基于声学特征的发音质量评价  32-40
  3.1 声学特征的选取  32-33
  3.2 共振峰频率的提取  33-35
  3.3 声学建模及实验分析  35-40
    3.3.1 声学建模  35-36
    3.3.2 实验分析  36-40
第4章 基于韵律特征的发音质量评价  40-54
  4.1 韵律特征的选取  40
  4.2 韵律特征的提取  40-52
    4.2.1 基音频率提取及实验分析  40-45
    4.2.2 短时能量提取及实验分析  45-48
    4.2.3 段长提取及实验分析  48-50
    4.2.4 韵律特征的长时特征提取及实验分析  50-52
  4.3 韵律建模及实验分析  52-54
    4.3.1 韵律建模  52-53
    4.3.2 实验分析  53-54
第5章 基于感知特征的发音质量评价  54-72
  5.1 感知特征分析  54
  5.2 感知特征提取及实验分析  54-70
    5.2.1 Bark 谱  54-59
    5.2.2 MFCC 谱  59-62
    5.2.3 MFSC 谱  62-66
    5.2.4 HBSCC 谱  66-70
  5.3 感知建模及实验分析  70-72
    5.3.1 综合多种感知特征的实验分析  70-71
    5.3.2 感知建模  71
    5.3.3 实验分析  71-72
第6章 综合多种特征的语音评分  72-78
  6.1 语音评分方案  72-73
    6.1.1 BP 权值训练  72-73
    6.1.2 主观分数映射  73
  6.2 BP 训练  73-75
  6.3 BP 评分实验  75-78
    6.3.1 测试实验  75-76
    6.3.2 相关性分析  76-78
第7章 发音质量评价的原型系统  78-82
  7.1 系统设计  78
  7.2 功能模块设计  78-79
  7.3 系统实例演示  79-82
结论  82-84
参考文献  84-86
攻读学位期间发表论文与研究成果清单  86-88
致谢  88

相似论文

  1. 词尾“(?)”和“(?)”的韵律学特征研究,H55
  2. 普通话的态度语音韵律研究,H116
  3. 母语为英语的留学生汉语二字组韵律偏误研究,H195
  4. 多特征结合的语音情感识别方法研究,TN912.3
  5. 基于韵律特征的SVM说话人识别,TN912.34
  6. 中国大学生英语双元音声学特征个案研究,H319
  7. 中日发音人普通话声母的声学特征,H116.1
  8. 美国留学生汉语陈述句核心重音的韵律表现研究,H195
  9. 汉语母语者与日本学习者汉语普通话音位/u/的声学特征比较,H195
  10. 基于韵律序列特征和非时序特征的音频场景识别,TP391.41
  11. 高中生音乐感知特征与音乐教学策略研究,G633.951
  12. 小麦碰撞音频信号预处理方法研究,TN912.3
  13. 基于多特征融合的室内机器人视觉环境理解研究,TP242
  14. 泰国留学生汉语陈述句句重音声学特征,H195
  15. 语种识别中的若干问题研究,TN912.34
  16. 基于认知无线电的频谱感知技术的研究,TN92
  17. 基于BP神经网络的语音情感识别算法的研究,TN912.34
  18. 基于Blackfin处理器的声学测量仪器通用硬件平台,TB52
  19. “X说”的语法化与主观性研究,H146
  20. 南方汉语儿向语的音高特征研究,H116

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com