学位论文 > 优秀研究生学位论文题录展示

鲁棒语音识别技术的研究

作　者: 董婧
导　师: 赵晓晖
学　校: 吉林大学
专　业: 通信与信息系统
关键词: 鲁棒语音识别语音增强共轭梯度小波变换基音提取端点检测特征参数提取
分类号: TN912.34
类　型: 博士论文
年　份: 2007年
下　载: 872次
引　用: 8次
阅　读: 论文下载

内容摘要

鲁棒语音识别技术是语音识别系统从实验室理论走向实际应用的关键性技术之一,其研究的主要目的是解决训练环境与应用环境之间失配所造成的识别率下降问题,本文在总结和分析现有多种鲁棒性识别算法的基础上,主要针对加性噪声的影响,在语音增强、基音提取、端点检测、鲁棒特征参数的选择等方面进行了深入地研究和探讨。采用共轭梯度递推求解带噪语音三阶累积量的修正Yule-Walker方程,以此估计纯净语音的生成模型参数和激励增益,提出了一种基于高阶累积量的卡尔曼滤波语音增强算法,增强后的语音失真度小,适合于识别系统的前端预处理。根据信号不连续性在小波变换不同分辨率下的可传递性,结合循环平均幅度差函数,提出了一种基于小波变换的循环平均幅度差基音提取算法(WCAMDF);同时,研究了小波多阈值估计在语音增强中的应用问题,基于小波对噪声的强抑制性,结合短时能量和谱熵函数将小波在基音提取及语音增强中的结果分别用于端点检测,给出了用于噪声环境中端点检测的两种鲁棒性特征。最后从特征空间研究了鲁棒语音识别中的特征参数提取问题,提出了三种基于MFCC的鲁棒特征参数改进策略:TEMFCC、LDA-TEMFCC和HOC-LPC-MFCC。在不同噪声环境下,对各种鲁棒识别算法进行仿真实验,成功实现了对加性噪声的抑制,验证了新算法的优良鲁棒性。

全文目录

提要  4-9
第一章绪论  9-17
  1.1 语音识别技术研究背景  9
  1.2 语音识别技术研究目的意义进程  9-11
  1.3 发展前景  11-12
  1.4 面临的难题  12-13
  1.5 论文主要工作和研究成果  13-15
  1.6 章节安排  15-17
第二章鲁棒语音识别  17-32
  2.1 引言  17-18
  2.2 影响语音识别的环境因素  18-20
  2.3 目前主流的抗噪声语音识别技术和发展现状  20-29
    2.3.1 模型构成  20-21
    2.3.2 基于信号空间的鲁棒技术—语音增强  21-23
    2.3.3 基于特征空间的鲁棒技术—提取抗噪声语音特征  23-28
    2.3.4 基于模型空间的鲁棒技术—模型补偿  28-29
  2.4 语音识别系统的性能评测  29-31
    2.4.1 识别率  30
    2.4.2 系统复杂度  30-31
  2.5 小结  31-32
第三章基于HMM的语音识别系统  32-43
  3.1 引言  32
  3.2 HMM基本原理  32-34
    3.2.1 HMM基本思想  32-33
    3.2.2 描述HMM的基本参数  33-34
  3.3 三个问题及解决方法  34-36
    3.3.1 估计问题  34-35
    3.3.2 解码问题  35
    3.3.3 学习问题  35-36
  3.4 本文采用的基于HMM的语音识别系统  36-42
    3.4.1 语音库和噪声库  36-37
    3.4.2 基于HMM的孤立词语音识别系统  37-40
    3.4.3 基于HTK的汉语数字识别系统  40-42
  3.5 小结  42-43
第四章基于高阶累积量的语音增强技术  43-70
  4.1 引言  43
  4.2 语音增强技术简介  43-48
    4.2.1 谱减法  43-45
    4.2.2 基于信号子空间的语音增强算法  45
    4.2.3 卡尔曼滤波  45-48
  4.3 高阶累积量  48-51
    4.3.1 高阶矩和高阶累积量  49
    4.3.2 高斯过程的高阶累积量  49-50
    4.3.3 高阶累积量的性质  50-51
  4.4 基于高阶累积量的参数估计  51-56
    4.4.1 传统求解方法  52-54
    4.4.2 共轭梯度求解  54-56
  4.5 用共轭梯度算法求解MYW方程的结果分析  56-62
    4.5.1 AR模型参数估计比较  56-59
    4.5.2 谱估计比较  59-62
  4.6 语音增强效果分析  62-66
  4.7 采用增强语音进行识别的效果分析  66-68
  4.8 小结  68-70
第五章基于小波分析的鲁棒语音识别  70-106
  5.1 引言  70-71
  5.2 小波理论及其性质简介  71-74
    5.2.1 傅立叶变换  71
    5.2.2 短时傅立叶变换  71-72
    5.2.3 小波变换的含义  72-74
  5.3 基于小波变换的基音检测算法  74-88
    5.3.1 常用的基音检测算法  75-77
    5.3.2 基于小波的基音检测算法原理  77-78
    5.3.3 小波基的选择  78-80
    5.3.4 尺度的选择及模极大值的提取  80-81
    5.3.5 小波基音检测中发现的问题  81-82
    5.3.6 循环平均幅度差函数的小波基音检测  82-83
    5.3.7 算法性能分析  83-88
  5.4 基于小波的多阈值语音增强  88-94
    5.4.1 小波多阈值降噪的基本原理  89
    5.4.2 阈值的计算  89-91
    5.4.3 语音增强阈值的选择  91-94
  5.5 端点检测  94-105
    5.5.1 基本的端点检测算法  95-97
    5.5.2 基于WCAMDF基音提取的端点检测算法  97-102
    5.5.3 基于语音增强能量熵的端点检测算法  102-105
  5.6 小结  105-106
第六章基于特征提取的鲁棒语音识别  106-121
  6.1 引言  106
  6.2 Teager能量熵-MFCC特征参数  106-112
    6.2.1 MFCC参数简介  106-108
    6.2.2 Teager能量-熵  108-109
    6.2.3 Teager能量熵-MFCC特征参数（TEMFCC）  109-112
  6.3 基于LDA的TEMFCC鲁棒特征参数  112-118
    6.3.1 LDA算法基本原理  113-114
    6.3.2 基于LDA的TEMFCC  114-118
  6.4 基于高阶累积量LPC参数的MFCC  118-120
  6.5 小结  120-121
第七章总结与展望  121-123
  7.1 工作总结  121-122
  7.2 工作展望  122-123
参考文献  123-131
攻读博士学位期间发表的学术论文及参加的科研项目  131-133
致谢  133-134
摘要  134-138
ABSTRACT  138-142

鲁棒语音识别技术的研究

内容摘要

全文目录

相似论文