学位论文 > 优秀研究生学位论文题录展示
基于回声状态网络的非特定人孤立词语音识别方法研究
作 者: 苗瑾
导 师: 杨凌
学 校: 兰州大学
专 业: 通信与信息系统
关键词: MFCC △MFCC IMFCC PSO ESN 非特定人孤立词语音识别
分类号: TN912.34
类 型: 硕士论文
年 份: 2012年
下 载: 61次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机技术不断向便携化发展及其环境的日趋复杂化,人类迫切希望摆脱键盘的束缚而代之以一种更便捷、自然、有效的输入方式与计算机进行交流。语音识别技术正是在这样的环境中发展起来的,目前,语音识别技术已经得到了广泛的应用。采用现代化手段研究语音识别技术,可以有效的帮助我们产生、存储和获取语音信号,这对促进社会的发展意义深远。语音识别系统主要包括预处理、特征提取和识别单元三部分,其中,特征参数的选取和识别单元的选择显得尤为重要。基于人耳听觉特性提出的MFCC参数作为语音信号的特征参数存在两点不足,一是不能反映语音信号的动态特性,二是对高频语音信号的描述精度不够,针对这一问题,本文引入其差分量(△MFCC)和IMFCC系数,组成混合特征参数MFCC+△MFCC+IMFCC作为识别网络的输入;另外,本文采用了一种新型的递归神经网络——ESN作为识别网络,并针对其在实际应用中网络参数设置缺乏有效理论指导及常规训练方法易导致病态解的问题,分别予以解决,对非特定人孤立词语音识别的仿真实验结果表明,所选的特征参数和模型均能在一定程度上有效地提高语音识别率。本文的具体识别算法均在MATLAB中进行了仿真,本文首先对语音信号的预处理进行了实现;其次分别就LPCC.MFCC和基于MFCC勺混合特征参数(MFCC+△MFCC+IMFCC)做了两组仿真实验,第一组实验证明了基于MFCC的混合特征参数能更好的体现语音信号的特征,第二组实验证明了基于MFCC的混合特征参数具有较好的抗噪性能;最后就改进前后的ESN做了仿真实验,证明了改进型ESN能有效的提高语音信号的识别率
|
全文目录
摘要 3-4 Abstract 4-8 第一章 引言 8-12 1.1 研究背景及意义 8 1.2 国内外研究现状 8-10 1.3 语音识别面临的困难 10-11 1.4 本文研究内容与组织结构 11-12 第二章 语音识别系统 12-21 2.1 语音识别系统简介 12 2.2 语音识别系统的分类 12-13 2.3 语音信号的预处理 13-18 2.3.1 预滤波和采样量化 13-14 2.3.2 预加重 14 2.3.3 分帧和加窗 14-16 2.3.4 端点检测 16-18 2.4 孤立词语音识别系统的识别方法 18-20 2.4.1 动态时间规整 19 2.4.2 矢量量化 19-20 2.4.3 隐马尔可夫模型 20 2.4.4 人工神经网络 20 2.5 本章小结 20-21 第三章 特征参数的选择及提取 21-27 3.1 LPC特征参数 21-22 3.2 LPCC特征参数 22 3.3 MFCC特征参数 22-24 3.4 基于MFCC的混合特征参数 24-26 3.4.1 差分MFCC参数的提取 25 3.4.2 IMFCC参数的提取 25-26 3.5 本章小结 26-27 第四章 回声状态网络 27-37 4.1 回声状态网络的结构及学习算法 27-28 4.2 ESN的优化 28-37 4.2.1 储备池的优化 28-32 4.2.1.1 储备池参数对网络性能的影响 29-31 4.2.1.2 储备池参数的优化方法 31-32 4.2.2 输出权值的优化 32-37 4.2.2.1 粒子群优化算法 32-34 4.2.2.2 PSO-ESN模型 34-37 第五章 仿真实验 37-46 5.1 实验数据样本 37 5.2 语音信号的预处理仿真 37-40 5.2.1 语音信号的预滤波和采样量化仿真 37-38 5.2.2 语音信号预加重仿真 38 5.2.3 语音信号的分帧加窗仿真 38-39 5.2.4 语音信号的端点检测仿真 39-40 5.3 基于特征参数的仿真 40-44 5.3.1 基于LPCC参数的仿真 40-41 5.3.2 基于MFCC参数的仿真 41-42 5.3.3 基于混合参数的仿真 42-44 5.4 基于ESN别网络的仿真 44-46 5.4.1 网络的训练及识别 44-45 5.4.2 仿真实验及分析 45-46 第六章 结论 46-47 参考文献 47-51 在学期间的研究成果 51-52 致谢 52
|
相似论文
- 基于ARM9的孤立词语音识别系统设计,TN912.34
- 基于RFID监狱智能管理系统研究与实现,TP315
- 虚拟现实中混合碰撞检测算法的应用研究,TP391.9
- 几类非合作对策最优解的算法及其应用研究,O224
- 基于DE-PSO算法的周期可变石化产品产供销计划模型研究,F426.72;F224
- 基于粒子群优化算法和支持向量机的上市公司财务危机预警研究,F275
- 基于蒙特卡洛方法和改进PSO算法的装配公差优化设计,TG801
- 基于数字信号处理的相干光通信系统补偿技术的研究,TN929.1
- 基于混沌免疫粒子群算法的阵列天线方向图综合,TN820.12
- 基于小波和神经网络理论的电力系统负荷预测研究,TM715
- 基于MIDI的乐器控制系统和音符的自动识别方法研究,TN912.34
- 基于改进PSO的发酵补料速率的优化控制,TQ920.6
- 中央空调主机能耗分析及其水系统节能控制研究,TU831.3
- 基于改进PSO算法的网格任务调度算法,TP393.09
- 基于模糊综合评判入侵检测系统的研究,TP393.08
- 眼底图像融合的研究及系统实现,TP391.41
- 基于VC++6.0的说话人识别系统的研究,TN912.34
- 基于HMM-ANN混合模型的咳嗽音识别研究,TN912.34
- 梯级水电站联合发电优化调度方法研究与应用,TV737
- 基于PSO优化的BP神经网络股票预测模型,TP183
- PSO算法在单层建筑物人群疏散仿真中的应用,TP301.6
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|