学位论文 > 优秀研究生学位论文题录展示

鲁棒语音识别技术的研究

作 者: 董婧
导 师: 赵晓晖
学 校: 吉林大学
专 业: 通信与信息系统
关键词: 鲁棒语音识别 语音增强 共轭梯度 小波变换 基音提取 端点检测 特征参数提取
分类号: TN912.34
类 型: 博士论文
年 份: 2007年
下 载: 872次
引 用: 8次
阅 读: 论文下载
 

内容摘要


鲁棒语音识别技术是语音识别系统从实验室理论走向实际应用的关键性技术之一,其研究的主要目的是解决训练环境与应用环境之间失配所造成的识别率下降问题,本文在总结和分析现有多种鲁棒性识别算法的基础上,主要针对加性噪声的影响,在语音增强基音提取端点检测、鲁棒特征参数的选择等方面进行了深入地研究和探讨。采用共轭梯度递推求解带噪语音三阶累积量的修正Yule-Walker方程,以此估计纯净语音的生成模型参数和激励增益,提出了一种基于高阶累积量的卡尔曼滤波语音增强算法,增强后的语音失真度小,适合于识别系统的前端预处理。根据信号不连续性在小波变换不同分辨率下的可传递性,结合循环平均幅度差函数,提出了一种基于小波变换的循环平均幅度差基音提取算法(WCAMDF);同时,研究了小波多阈值估计在语音增强中的应用问题,基于小波对噪声的强抑制性,结合短时能量和谱熵函数将小波在基音提取及语音增强中的结果分别用于端点检测,给出了用于噪声环境中端点检测的两种鲁棒性特征。最后从特征空间研究了鲁棒语音识别中的特征参数提取问题,提出了三种基于MFCC的鲁棒特征参数改进策略:TEMFCC、LDA-TEMFCC和HOC-LPC-MFCC。在不同噪声环境下,对各种鲁棒识别算法进行仿真实验,成功实现了对加性噪声的抑制,验证了新算法的优良鲁棒性。

全文目录


提要  4-9
第一章 绪论  9-17
  1.1 语音识别技术研究背景  9
  1.2 语音识别技术研究目的意义进程  9-11
  1.3 发展前景  11-12
  1.4 面临的难题  12-13
  1.5 论文主要工作和研究成果  13-15
  1.6 章节安排  15-17
第二章 鲁棒语音识别  17-32
  2.1 引言  17-18
  2.2 影响语音识别的环境因素  18-20
  2.3 目前主流的抗噪声语音识别技术和发展现状  20-29
    2.3.1 模型构成  20-21
    2.3.2 基于信号空间的鲁棒技术—语音增强  21-23
    2.3.3 基于特征空间的鲁棒技术—提取抗噪声语音特征  23-28
    2.3.4 基于模型空间的鲁棒技术—模型补偿  28-29
  2.4 语音识别系统的性能评测  29-31
    2.4.1 识别率  30
    2.4.2 系统复杂度  30-31
  2.5 小结  31-32
第三章 基于HMM的语音识别系统  32-43
  3.1 引言  32
  3.2 HMM基本原理  32-34
    3.2.1 HMM基本思想  32-33
    3.2.2 描述HMM的基本参数  33-34
  3.3 三个问题及解决方法  34-36
    3.3.1 估计问题  34-35
    3.3.2 解码问题  35
    3.3.3 学习问题  35-36
  3.4 本文采用的基于HMM的语音识别系统  36-42
    3.4.1 语音库和噪声库  36-37
    3.4.2 基于HMM的孤立词语音识别系统  37-40
    3.4.3 基于HTK的汉语数字识别系统  40-42
  3.5 小结  42-43
第四章 基于高阶累积量的语音增强技术  43-70
  4.1 引言  43
  4.2 语音增强技术简介  43-48
    4.2.1 谱减法  43-45
    4.2.2 基于信号子空间的语音增强算法  45
    4.2.3 卡尔曼滤波  45-48
  4.3 高阶累积量  48-51
    4.3.1 高阶矩和高阶累积量  49
    4.3.2 高斯过程的高阶累积量  49-50
    4.3.3 高阶累积量的性质  50-51
  4.4 基于高阶累积量的参数估计  51-56
    4.4.1 传统求解方法  52-54
    4.4.2 共轭梯度求解  54-56
  4.5 用共轭梯度算法求解MYW方程的结果分析  56-62
    4.5.1 AR模型参数估计比较  56-59
    4.5.2 谱估计比较  59-62
  4.6 语音增强效果分析  62-66
  4.7 采用增强语音进行识别的效果分析  66-68
  4.8 小结  68-70
第五章 基于小波分析的鲁棒语音识别  70-106
  5.1 引言  70-71
  5.2 小波理论及其性质简介  71-74
    5.2.1 傅立叶变换  71
    5.2.2 短时傅立叶变换  71-72
    5.2.3 小波变换的含义  72-74
  5.3 基于小波变换的基音检测算法  74-88
    5.3.1 常用的基音检测算法  75-77
    5.3.2 基于小波的基音检测算法原理  77-78
    5.3.3 小波基的选择  78-80
    5.3.4 尺度的选择及模极大值的提取  80-81
    5.3.5 小波基音检测中发现的问题  81-82
    5.3.6 循环平均幅度差函数的小波基音检测  82-83
    5.3.7 算法性能分析  83-88
  5.4 基于小波的多阈值语音增强  88-94
    5.4.1 小波多阈值降噪的基本原理  89
    5.4.2 阈值的计算  89-91
    5.4.3 语音增强阈值的选择  91-94
  5.5 端点检测  94-105
    5.5.1 基本的端点检测算法  95-97
    5.5.2 基于WCAMDF基音提取的端点检测算法  97-102
    5.5.3 基于语音增强能量熵的端点检测算法  102-105
  5.6 小结  105-106
第六章 基于特征提取的鲁棒语音识别  106-121
  6.1 引言  106
  6.2 Teager能量熵-MFCC特征参数  106-112
    6.2.1 MFCC参数简介  106-108
    6.2.2 Teager能量-熵  108-109
    6.2.3 Teager能量熵-MFCC特征参数(TEMFCC)  109-112
  6.3 基于LDA的TEMFCC鲁棒特征参数  112-118
    6.3.1 LDA算法基本原理  113-114
    6.3.2 基于LDA的TEMFCC  114-118
  6.4 基于高阶累积量LPC参数的MFCC  118-120
  6.5 小结  120-121
第七章 总结与展望  121-123
  7.1 工作总结  121-122
  7.2 工作展望  122-123
参考文献  123-131
攻读博士学位期间发表的学术论文及参加的科研项目  131-133
致谢  133-134
摘要  134-138
ABSTRACT  138-142

相似论文

  1. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
  2. 图像的稀疏表示及编码模型研究,TP391.41
  3. 唇读中的特征提取、选择与融合,TP391.41
  4. 二维波动方程测井约束反演的自适应同伦共轭梯度法,P631.81
  5. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  6. 感觉刺激诱发脑电特征研究,R318.0
  7. 网络传输中的ROI图像编码算法研究,TN919.81
  8. 基于多尺度分析的图像融合算法研究,TP391.41
  9. 基于小波变换的三维模型特征提取技术的研究与实现,TP391.41
  10. 轮廓波变换及其在图像处理中的应用,TP391.41
  11. 基于小波的雷达视频压缩方法研究,TN957.52
  12. 脊波变换在全色图像和多光谱图像融合中的应用研究,TP391.41
  13. 一种多数据流聚类异常检测算法,TP311.13
  14. 基于图像的信息隐藏技术研究,TP309.7
  15. 基于DM6446与小波的图像压缩系统设计与实现,TP391.41
  16. 结合DWT的动态数据校正研究及应用,TP274
  17. 基于小波变换和马尔可夫链的流量预测模型,TP393.06
  18. 基于小波变换的信号稀疏表示及其在图像去噪中的应用,TP391.41
  19. 基于离散小波变换的图像水印算法研究,TP309.7
  20. 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
  21. 脑部CT图像的压缩应用,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com