学位论文 > 优秀研究生学位论文题录展示

基于音素的错误发音自动检测方法研究与应用

作 者: 冯鑫
导 师: 张军英
学 校: 西安电子科技大学
专 业: 计算机软件与理论
关键词: 错误发音检测 音系比较 计算机辅助语言学习 语音识别
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 21次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语音识别技术经过多年的发展,现在开始逐渐走进不同的应用中。近年来,语言学习和口语发音检测的研究已经受到越来越多的关注,语音识别在计算机辅助语言学习中的应用成为一个重要的研究方向。特别是音频作为一种信息媒介,在人机交互过程中起到了重要的作用。本文提出一种利用语音识别技术,对母语为中文(L1)的英语(L2)学习者错误音素发音的自动检测系统。本文的方法通过预测语言学习者发音中可能导致错误发音的音素混淆规则来扩展标准发音词典,生成包含每个词的标准发音和可能错误发音变化的扩展发音词典,自动语音识别利用扩展发音词典来检测和诊断学习者的错误音素发音,并提供纠正反馈。音素混淆规则引用语言迁移的理论,我们通过系统的跨语言音系对比分析L1与L2之间在音素发音上的差异来生成,并采用数据驱动的方法:对学习者语音做自动音素识别,分析识别结果中所产生的错误发音与对应的标准发音之间的映射关系,来自动生成额外的音素混淆规则。在这种基于音素混淆规则的组合替换方法而生成的扩展发音词典中存在许多不合理的发音,为此,本文提出一种自动修剪的优化方法来提取其中合理而常见的错误发音。本文对21位英语学习者录音的实验结果说明,系统的检测结果在与专家标注文本的对比中,得到超过86%的一致率,经修剪后的扩展发音词典比完整的扩展发音词典能更好的检测错误音素发音。

全文目录


摘要  3-4
Abstract  4-7
第一章 绪论  7-17
  1.1 本文研究背景  7-11
    1.1.1 研究意义  7-9
    1.1.2 国内外研究现状及分析  9-11
  1.2 相关研究技术  11-15
    1.2.1 语言学发音分析  11-12
    1.2.2 语音识别  12-13
    1.2.3 发音检测评价方法  13-15
  1.3 本文的贡献  15-16
  1.4 本文的组织  16-17
第二章 错误音素发音自动检测系统设计  17-23
  2.1 系统总体结构设计  17-18
  2.2 子模块分析  18-21
    2.2.1 音素混淆规则与扩展发音词典的生成  18-19
    2.2.2 语音识别系统设计  19-20
    2.2.3 发音检测方法与反馈设计  20-21
  2.3 本章小结  21-23
第三章 扩展发音词典的生成  23-33
  3.1 跨语言音系对比方法  24-28
    3.1.1 元音与双元音  24-25
    3.1.2 辅音  25-26
    3.1.3 扩展发音词典  26-28
  3.2 数据驱动方法  28-30
  3.3 扩展发音词典的自动修剪方法  30-32
  3.4 本章小结  32-33
第四章 基于语音识别的发音检测与反馈  33-45
  4.1 基于HMM的声学模型  33-41
    4.1.1 HMM模型  34-39
    4.1.2 构建声学模型  39-41
  4.2 发音检测与反馈  41-43
    4.2.1 发音混淆网络下的强制规整  41-42
    4.2.2 纠正反馈  42-43
  4.3 本章小结  43-45
第五章 实验、评估方法及系统软件应用  45-53
  5.1 实验数据  45
  5.2 评估方法  45-47
  5.3 实验结果  47-50
    5.3.1 声学模型评估  47
    5.3.2 系统评估  47-49
    5.3.3 错误音素发音反馈  49-50
  5.4 应用软件开发实现  50-51
  5.5 本章小结  51-53
第六章 结束语  53-55
  6.1 本文工作总结  53
  6.2 下一步研究方向  53-55
致谢  55-57
参考文献  57-61
作者攻读硕士学位期间的研究成果  61-63
附录  63

相似论文

  1. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  2. 基于DSP的机器人语音命令识别系统研制,TN912.34
  3. 仿真机器人控制系统,TP242
  4. 基于稳健性PLPC的抗噪语音识别方法的研究,TN912.34
  5. 移动机器人语音识别系统的研究与实现,TN912.34
  6. 机器人假肢的控制系统设计与研究,TP242
  7. 基于USB Audio设备类的音频密钥系统设计,TP309.7
  8. 计算机课件辅助二语词汇习得,H319
  9. 一项基于网络听力环境的学习自主性调查,G434
  10. 汉语连续语音的音节自动标注算法研究及实现,TN912.34
  11. 基于实例语境的语音识别后文本检错与纠错研究,TN912.34
  12. 多媒体环境下词汇习得的研究,H319
  13. 文化算法优化RBF神经网络及应用研究,TP183
  14. 计算机辅助教学环境下以培养学习者自主性为目标的教师角色研究,G434
  15. 基于云计算的语音输入方案研究,TN912.34
  16. 基于词片网格的语音文档主题分类,TN912.3
  17. 《体验英语学习系统》对英语听力效果的影响,H319
  18. 基于非特定人车载电器语音集成控制系统的设计与实现,TN912.3
  19. VOIP声学回声消除归一化算法研究,TN916.2
  20. 孤立词语音识别的算法研究及其基于SOPC的硬件系统实现,TN912.34

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com