学位论文 > 优秀研究生学位论文题录展示

基于回声状态网络的非特定人孤立词语音识别方法研究

作　者: 苗瑾
导　师: 杨凌
学　校: 兰州大学
专　业: 通信与信息系统
关键词: MFCC △MFCC IMFCC PSO ESN 非特定人孤立词语音识别
分类号: TN912.34
类　型: 硕士论文
年　份: 2012年
下　载: 61次
引　用: 0次
阅　读: 论文下载

内容摘要

随着计算机技术不断向便携化发展及其环境的日趋复杂化,人类迫切希望摆脱键盘的束缚而代之以一种更便捷、自然、有效的输入方式与计算机进行交流。语音识别技术正是在这样的环境中发展起来的,目前,语音识别技术已经得到了广泛的应用。采用现代化手段研究语音识别技术,可以有效的帮助我们产生、存储和获取语音信号,这对促进社会的发展意义深远。语音识别系统主要包括预处理、特征提取和识别单元三部分,其中,特征参数的选取和识别单元的选择显得尤为重要。基于人耳听觉特性提出的MFCC参数作为语音信号的特征参数存在两点不足,一是不能反映语音信号的动态特性,二是对高频语音信号的描述精度不够,针对这一问题,本文引入其差分量(△MFCC)和IMFCC系数,组成混合特征参数MFCC+△MFCC+IMFCC作为识别网络的输入；另外,本文采用了一种新型的递归神经网络——ESN作为识别网络,并针对其在实际应用中网络参数设置缺乏有效理论指导及常规训练方法易导致病态解的问题,分别予以解决,对非特定人孤立词语音识别的仿真实验结果表明,所选的特征参数和模型均能在一定程度上有效地提高语音识别率。本文的具体识别算法均在MATLAB中进行了仿真,本文首先对语音信号的预处理进行了实现；其次分别就LPCC.MFCC和基于MFCC勺混合特征参数(MFCC+△MFCC+IMFCC)做了两组仿真实验,第一组实验证明了基于MFCC的混合特征参数能更好的体现语音信号的特征,第二组实验证明了基于MFCC的混合特征参数具有较好的抗噪性能；最后就改进前后的ESN做了仿真实验,证明了改进型ESN能有效的提高语音信号的识别率

全文目录

摘要  3-4
Abstract  4-8
第一章引言  8-12
  1.1 研究背景及意义  8
  1.2 国内外研究现状  8-10
  1.3 语音识别面临的困难  10-11
  1.4 本文研究内容与组织结构  11-12
第二章语音识别系统  12-21
  2.1 语音识别系统简介  12
  2.2 语音识别系统的分类  12-13
  2.3 语音信号的预处理  13-18
    2.3.1 预滤波和采样量化  13-14
    2.3.2 预加重  14
    2.3.3 分帧和加窗  14-16
    2.3.4 端点检测  16-18
  2.4 孤立词语音识别系统的识别方法  18-20
    2.4.1 动态时间规整  19
    2.4.2 矢量量化  19-20
    2.4.3 隐马尔可夫模型  20
    2.4.4 人工神经网络  20
  2.5 本章小结  20-21
第三章特征参数的选择及提取  21-27
  3.1 LPC特征参数  21-22
  3.2 LPCC特征参数  22
  3.3 MFCC特征参数  22-24
  3.4 基于MFCC的混合特征参数  24-26
    3.4.1 差分MFCC参数的提取  25
    3.4.2 IMFCC参数的提取  25-26
  3.5 本章小结  26-27
第四章回声状态网络  27-37
  4.1 回声状态网络的结构及学习算法  27-28
  4.2 ESN的优化  28-37
    4.2.1 储备池的优化  28-32
      4.2.1.1 储备池参数对网络性能的影响  29-31
      4.2.1.2 储备池参数的优化方法  31-32
    4.2.2 输出权值的优化  32-37
      4.2.2.1 粒子群优化算法  32-34
      4.2.2.2 PSO-ESN模型  34-37
第五章仿真实验  37-46
  5.1 实验数据样本  37
  5.2 语音信号的预处理仿真  37-40
    5.2.1 语音信号的预滤波和采样量化仿真  37-38
    5.2.2 语音信号预加重仿真  38
    5.2.3 语音信号的分帧加窗仿真  38-39
    5.2.4 语音信号的端点检测仿真  39-40
  5.3 基于特征参数的仿真  40-44
    5.3.1 基于LPCC参数的仿真  40-41
    5.3.2 基于MFCC参数的仿真  41-42
    5.3.3 基于混合参数的仿真  42-44
  5.4 基于ESN别网络的仿真  44-46
    5.4.1 网络的训练及识别  44-45
    5.4.2 仿真实验及分析  45-46
第六章结论  46-47
参考文献  47-51
在学期间的研究成果  51-52
致谢  52

基于回声状态网络的非特定人孤立词语音识别方法研究

内容摘要

全文目录

相似论文