学位论文 > 优秀研究生学位论文题录展示

基于HMM模型的混合特征参数语音识别方法的研究

作 者: 赵皓千
导 师: 乐静
学 校: 西安理工大学
专 业: 测试计量技术及仪器
关键词: 语音识别 特征提取 模式识别 混合特征参数 系统仿真
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 134次
引 用: 1次
阅 读: 论文下载
 

内容摘要


作为一个交叉学科,语音识别技术与许多学科的研究领域都有联系,这些领域的科研成果也成为推进语音识别技术发展的重要因素。当前,语音识别技术已经得到广泛应用。它正在家电产品、智能玩具、商业系统的数据库语音查询、工业生产部门的语声控制、电话与电信系统的自动拨号等领域发挥着重要作用,并且极有可能成为下一代操作系统的用户界面。虽然语音识别技术已经取得了一些成就,但是,由于语音信号的多样性和复杂性,目前的语音识别效率还有待提高,因而开发高效率语音识别模型和算法成为语音识别研究中的一个重要课题。本文分别对语音识别技术中的预处理、特征提取模式识别进行了细致的研究,其主要内容有:1.对于现有的语音识别系统模型进行研究,探讨了语音识别系统预处理、特征提取和模式识别等几个方面的理论,并根据论文中实验系统的需要,选择合适的参数以及信号处理方法,建立语音识别系统。2.在对特征提取理论研究的基础上,提出了基于混合特征参数的语音识别方法。在实验中,分析讨论了混合参数的合成阶数比例对语音识别系统识别率的影响。3.在对文中列出的语音识别技术分析讨论的基础上,本文在Matlab环境下实现了整个语音识别系统的仿真,并且分别建立了基于LPCC参数、MFCC参数和混合参数的三种语音识别系统。在此基础上,分析了特征参数的不同对于语音识别系统识别率的影响。通过对上述仿真实验的数据分析,得出以下结论,混合特征参数具有较好的语音信号描述能力;使用混合特征参数建立的语音识别系统与分别使用LPCC参数和MFCC参数建立的语音识别系统相比较,具有系统识别率高的优点。

全文目录


摘要  3-4
Abstract  4-6
目录  6-8
1 绪论  8-14
  1.1 课题研究目的与意义  8-10
  1.2 语音识别技术研究现状  10-11
  1.3 构建语音识别系统的难点问题  11-12
  1.4 本文主要工作及论文内容安排  12-14
2 语音识别技术基本原理  14-26
  2.1 语音识别系统构成  14-18
    2.1.1 语音信号的预处理  14-17
    2.1.2 语音信号的端点检测技术  17-18
  2.2 常用特征参数提取  18-23
    2.2.1 LPCC参数  19-21
    2.2.2 MFCC参数  21-23
  2.3 混合特征参数的提取  23-25
  2.4 本章小结  25-26
3 模式识别  26-36
  3.1 DTW动态时间规整  26-30
  3.2 HMM隐马尔可夫模型  30
  3.3 ANN人工神经网络  30-34
  3.4 本章小结  34-36
4 基于HMM模型的语音识别系统  36-46
  4.1 HMM模型  36-37
  4.2 HMM模型的三个基本问题的解决方法  37-40
    4.2.1 前向-后向算法  38-39
    4.2.2 Viterbi算法  39-40
    4.2.3 Baum-Welch算法  40
  4.3 基于HMM模型的语音识别系统设计  40-45
    4.3.1 HMM模型的选取  40-41
    4.3.2 拓扑形式和状态个数选取  41-45
  4.4 本章小结  45-46
5 Matlab系统仿真与讨论  46-62
  5.1 仿真实验原理  46-58
    5.1.1 语音信号采集  47-49
    5.1.2 预处理  49-51
    5.1.3 特征提取  51-55
    5.1.4 语音识别  55-58
  5.2 实验结果及分析  58-61
    5.2.1 混合特征参数参数性能分析  58-60
    5.2.2 特征参数性能比较  60-61
  5.3 本章小结  61-62
6 总结与展望  62-64
致谢  64-66
参考文献  66-67

相似论文

  1. 基于流形学习的高维流场数据分类研究,V231.3
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 船用舵机电液伺服单元单神经元PID控制,U666.152
  4. HID灯整流效应的研究,TM923.32
  5. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  6. 基于DSP的机器人语音命令识别系统研制,TN912.34
  7. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  8. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  9. Q学习在基于内容图像检索技术中的应用,TP391.41
  10. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  11. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  12. 基于仿生模式识别的文本分类技术研究,TP391.1
  13. 空间交会接近视觉测量方法研究,TP391.41
  14. 仿真系统模型验证方法和工具研究,TP391.9
  15. 图像实时采集、存储与处理方法研究,TP391.41
  16. 唇读中的特征提取、选择与融合,TP391.41
  17. 多币种纸币处理技术的研究与实现,TP391.41
  18. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  19. 基于图像的路面破损识别,TP391.41
  20. 基于神经网络的水厂投药预测控制研究,TP273.1
  21. 大气层内动能拦截弹姿态控制规律设计,TJ765.23

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com