学位论文 > 优秀研究生学位论文题录展示

基于HMM和人工神经网络相结合的语音识别研究

作 者: 彭靓
导 师: 余达祥
学 校: 南昌航空大学
专 业: 控制工程
关键词: 语音识别 HMM模型 人工神经网络 CDHMM
分类号: TN912.34
类 型: 硕士论文
年 份: 2013年
下 载: 41次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在计算机技术和信息技术不断发展的科技时代,各类智能机器也逐步在人们的生活中扮演起了重要角色,人们希望能和机器自然地沟通和交流,这种需求也使得语音识别得到了突飞猛进的发展。语音识别是一种前景广阔、社会效益广泛、经济效益明显的技术,在快速发展的同时,也因其经历着从实验室到实际应用的系列过程,因此不可避免地产生了一些问题。本文依据HMM的优点和缺点着手,根据HMM对动态时间序列所具有的有极强的建模能力,和较弱的分类决策能力。而人工神经网络算法收敛速度快,分类决策能力和对不确定信息的描述能力强的特点,提出了一种隐马尔可夫(HMM)模型和径向基神经网络(RBF)相结合的混合模型进行语音识别。在这基础上,为了证明混合模型的算法是否正确,本文在MATLAB环境下来分析混合模型仿真模型的计算方法,依据不相同的特征参数、训练样本数目、背景噪声的角度来探讨这一模型是否真能够进行语音识别。之后,还运用了CDHMM模型和HMMNN混合模型在广泛的人中采用汉语孤立数字语音识别实验,来证明哪一个模型实用性比较好。从这两个实验中我们可以发现,本文提出的模型来达到语音识别功能是正确的,HMMNN混合模型的效果比CDHMM语音识别效果好,增强了语音识别系统的鲁棒性。

全文目录


摘要  3-4
Abstract  4-7
第1章 绪论  7-16
  1.1 语音识别技术研究的背景和意义  7-8
  1.2 国内外研究现状  8-10
    1.2.1 国外研究现状  8-10
    1.2.2 国内研究现状  10
  1.3 语音识别技术的相关简介  10-13
    1.3.1 语音识别系统的分类  10-11
    1.3.2 语音系统识别的方式  11-13
    1.3.3 语音识别系统的构成  13
  1.4 语音识别技术所面临的问题  13-14
  1.5 本文研究的主要内容  14-16
第2章 语音识别的基本原理  16-27
  2.1 语音信号的预处理  16-20
    2.1.1 预加重  16
    2.1.2 分帧加窗  16-17
    2.1.3 端点检测  17-20
  2.2 语音信号特征提取  20-24
    2.2.1 有线性预测编码系数(LPC)  21-22
    2.2.2 线性预测倒谱系数(LPCC)  22-23
    2.2.3 Mel 频率倒谱系数(MFCC)  23-24
  2.3 语音识别的模板训练方法  24-25
  2.4 语音识别的模板匹配方法  25-27
第3章 HMM语音识别研究  27-38
  3.1 HMM的定义  27-28
  3.2 基于HMM语音识别的研究  28-33
    3.2.1 HMM模型的三个基本问题  28
    3.2.2 HMM模型基本问题的解决方案  28-33
  3.3 HMM算法实现中的问题  33-38
    3.3.1 初始模型的选取  33-34
    3.3.2 多观察值序列训练  34-35
    3.3.3 数据下溢问题  35-38
第4章 基于人工神经网络的语音识别研究  38-55
  4.1 人工神经网络概述  39-40
  4.2 人工神经网络的构成  40-42
    4.2.1 神经元  40-41
    4.2.2 网络拓扑结构  41
    4.2.3 网络实验算法  41-42
  4.3 几种模式识别方式的神经网络及其算法  42-47
    4.3.1 单层感知器  42-44
    4.3.2 双层感知器  44-46
    4.3.3 多层感知器  46-47
  4.4 径向基函数神经网络  47-53
    4.4.1 RBF神经网络的网络结构  47-48
    4.4.2 RBF神经网络的优势  48-50
    4.4.3 RBF神经网络的实验算法  50-53
  4.5 RBF神经网络的语音识别系统设计  53-55
第5章 仿真实验与结果分析  55-57
  5.1 语音信号的获取和数据库的建立  55
  5.2 语音信号的预处理  55
  5.3 语音信号的特征提取  55-56
  5.4 系统性能分析  56-57
    5.4.1 算法的准确性测试  56
    5.4.2 算法的抗噪性测试  56-57
第6章 结论与展望  57-58
参考文献  58-60
攻读硕士学位期间发表的论文  60-61
致谢  61-62

相似论文

  1. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  2. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  3. 基于DSP的机器人语音命令识别系统研制,TN912.34
  4. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  5. 酮类化合物的3D-QSPR研究,O641
  6. 语音识别技术研究与实现,TN912.34
  7. 基于遗传算法的前馈神经网络优化研究,TP183
  8. 人类抗原肽载体结合力预测,R392.1
  9. 基于粒子群优化神经网络的电力短期负荷预测研究,TM715
  10. ANN在海州露天矿区地下水水质评价与预测中的应用,X824
  11. 多模型阶梯式广义预测控制策略研究,TP273
  12. 食用植物油快速检测方法研究,TP274
  13. 基于SPCE061A单片机的数控机床控制系统的设计与实现,TG659
  14. IAMBR短程硝化—反硝化膜污染研究,X703
  15. 烟煤掺烧印尼煤的动力配煤模型研究,TK227.1
  16. 考虑光伏发电的短期负荷预测,TM715
  17. 风电场发电功率短期预测模型研究,TM715
  18. 人工神经网络在物探方法预测含水层含水量中的应用,P641.7
  19. 智能变形分析方法综合研究,P209
  20. 国际原油价格及其影响因素研究,F713.35;F224
  21. 水利工程项目综合效益评价研究,F282

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com