学位论文 > 优秀研究生学位论文题录展示
基于HMM和人工神经网络相结合的语音识别研究
作 者: 彭靓
导 师: 余达祥
学 校: 南昌航空大学
专 业: 控制工程
关键词: 语音识别 HMM模型 人工神经网络 CDHMM
分类号: TN912.34
类 型: 硕士论文
年 份: 2013年
下 载: 41次
引 用: 0次
阅 读: 论文下载
内容摘要
在计算机技术和信息技术不断发展的科技时代,各类智能机器也逐步在人们的生活中扮演起了重要角色,人们希望能和机器自然地沟通和交流,这种需求也使得语音识别得到了突飞猛进的发展。语音识别是一种前景广阔、社会效益广泛、经济效益明显的技术,在快速发展的同时,也因其经历着从实验室到实际应用的系列过程,因此不可避免地产生了一些问题。本文依据HMM的优点和缺点着手,根据HMM对动态时间序列所具有的有极强的建模能力,和较弱的分类决策能力。而人工神经网络算法收敛速度快,分类决策能力和对不确定信息的描述能力强的特点,提出了一种隐马尔可夫(HMM)模型和径向基神经网络(RBF)相结合的混合模型进行语音识别。在这基础上,为了证明混合模型的算法是否正确,本文在MATLAB环境下来分析混合模型仿真模型的计算方法,依据不相同的特征参数、训练样本数目、背景噪声的角度来探讨这一模型是否真能够进行语音识别。之后,还运用了CDHMM模型和HMMNN混合模型在广泛的人中采用汉语孤立数字语音识别实验,来证明哪一个模型实用性比较好。从这两个实验中我们可以发现,本文提出的模型来达到语音识别功能是正确的,HMMNN混合模型的效果比CDHMM语音识别效果好,增强了语音识别系统的鲁棒性。
|
全文目录
摘要 3-4 Abstract 4-7 第1章 绪论 7-16 1.1 语音识别技术研究的背景和意义 7-8 1.2 国内外研究现状 8-10 1.2.1 国外研究现状 8-10 1.2.2 国内研究现状 10 1.3 语音识别技术的相关简介 10-13 1.3.1 语音识别系统的分类 10-11 1.3.2 语音系统识别的方式 11-13 1.3.3 语音识别系统的构成 13 1.4 语音识别技术所面临的问题 13-14 1.5 本文研究的主要内容 14-16 第2章 语音识别的基本原理 16-27 2.1 语音信号的预处理 16-20 2.1.1 预加重 16 2.1.2 分帧加窗 16-17 2.1.3 端点检测 17-20 2.2 语音信号特征提取 20-24 2.2.1 有线性预测编码系数(LPC) 21-22 2.2.2 线性预测倒谱系数(LPCC) 22-23 2.2.3 Mel 频率倒谱系数(MFCC) 23-24 2.3 语音识别的模板训练方法 24-25 2.4 语音识别的模板匹配方法 25-27 第3章 HMM语音识别研究 27-38 3.1 HMM的定义 27-28 3.2 基于HMM语音识别的研究 28-33 3.2.1 HMM模型的三个基本问题 28 3.2.2 HMM模型基本问题的解决方案 28-33 3.3 HMM算法实现中的问题 33-38 3.3.1 初始模型的选取 33-34 3.3.2 多观察值序列训练 34-35 3.3.3 数据下溢问题 35-38 第4章 基于人工神经网络的语音识别研究 38-55 4.1 人工神经网络概述 39-40 4.2 人工神经网络的构成 40-42 4.2.1 神经元 40-41 4.2.2 网络拓扑结构 41 4.2.3 网络实验算法 41-42 4.3 几种模式识别方式的神经网络及其算法 42-47 4.3.1 单层感知器 42-44 4.3.2 双层感知器 44-46 4.3.3 多层感知器 46-47 4.4 径向基函数神经网络 47-53 4.4.1 RBF神经网络的网络结构 47-48 4.4.2 RBF神经网络的优势 48-50 4.4.3 RBF神经网络的实验算法 50-53 4.5 RBF神经网络的语音识别系统设计 53-55 第5章 仿真实验与结果分析 55-57 5.1 语音信号的获取和数据库的建立 55 5.2 语音信号的预处理 55 5.3 语音信号的特征提取 55-56 5.4 系统性能分析 56-57 5.4.1 算法的准确性测试 56 5.4.2 算法的抗噪性测试 56-57 第6章 结论与展望 57-58 参考文献 58-60 攻读硕士学位期间发表的论文 60-61 致谢 61-62
|
相似论文
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 酮类化合物的3D-QSPR研究,O641
- 语音识别技术研究与实现,TN912.34
- 基于遗传算法的前馈神经网络优化研究,TP183
- 人类抗原肽载体结合力预测,R392.1
- 基于粒子群优化神经网络的电力短期负荷预测研究,TM715
- ANN在海州露天矿区地下水水质评价与预测中的应用,X824
- 多模型阶梯式广义预测控制策略研究,TP273
- 食用植物油快速检测方法研究,TP274
- 基于SPCE061A单片机的数控机床控制系统的设计与实现,TG659
- IAMBR短程硝化—反硝化膜污染研究,X703
- 烟煤掺烧印尼煤的动力配煤模型研究,TK227.1
- 考虑光伏发电的短期负荷预测,TM715
- 风电场发电功率短期预测模型研究,TM715
- 人工神经网络在物探方法预测含水层含水量中的应用,P641.7
- 智能变形分析方法综合研究,P209
- 国际原油价格及其影响因素研究,F713.35;F224
- 水利工程项目综合效益评价研究,F282
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|