学位论文 > 优秀研究生学位论文题录展示

基于子空间的语音增强算法研究

作 者: 牛铜
导 师: 张连海
学 校: 解放军信息工程大学
专 业: 信号与信息处理
关键词: 语音增强 子空间 频域约束 感知加权 噪声谱估计 加权最小统计 噪声自相关估计 说话人辨识
分类号: TN912.35
类 型: 硕士论文
年 份: 2009年
下 载: 69次
引 用: 3次
阅 读: 论文下载
 

内容摘要


语音增强是以抑制噪声、提高语音信号听觉质量为根本目的一种解决噪声干扰的有效办法,是噪声环境下提高语音应用系统性能的重要手段之一。本文重点研究了基于子空间的语音增强算法和噪声估计算法,主要工作如下:提出了一种频域约束估计改进算法,解决了基于子空间的频域约束估计算法在有色噪声环境下性能较差的问题。该算法以降低语音信号的失真为主要目的,通过对频域约束估计理论的研究,同时结合广义特征值分解,将频域约束估计理论推广到有色噪声环境中。在白噪声和有色噪声环境下,给出了频域约束估计器的统一形式。实验采用非正式主观听辨实验与语音客观评价指标相结合的评价方法,结果表明,改进的子空间增强算法能够有效改善语音的质量,提高语音的可懂度。提出了一种感知加权改进的频域约束估计算法,降低了残余噪声对人耳感知的影响。该算法结合低速编码中常用的感知加权技术,在感知加权误差最小的准则下,实现了频域约束估计器。实验结果表明,该算法进一步改善了增强后语音的主观听觉质量。提出了一种加权最小统计的噪声谱估计改进算法,降低了最小统计噪声谱估计算法在噪声谱上升时的跟踪时延。通过分析加权对最小统计噪声谱估计算法的影响,采用3种简单典型曲线构造权值,用实验的方法比较得出由余弦曲线构造的权值最优。实验结果表明该算法能够快速跟踪噪声谱的变化,提高噪声谱估计的准确性,改善增强后语音的质量。并利用信号功率谱与自相关之间的关系,将改进的频域噪声估计算法应用于子空间语音增强算法中,提高了增强算法在非平稳噪声环境下的性能。提出了一种基于最优平滑滤波与能量最小算法的噪声自相关无偏估计算法。通过分析带噪语音、纯净语音和噪声的自相关之间的关系,利用最优平滑滤波与能量最小算法,在均方误差最小准则下得到了对噪声自相关的无偏估计。与传统的噪声自相关估计不同,该算法直接从带噪语音自相关中估计噪声自相关。实验表明,该算法优于传统的噪声自相关估计算法,在非平稳噪声环境下,能够有效改善估计器的性能。最后将本文所研究的增强算法作为前端预处理模块应用到说话人辨识系统中。实验结果表明,算法能够有效地减少噪声对特征提取的影响,提高噪声环境下的识别性能。

全文目录


表目录  7-8
图目录  8-9
摘要  9-10
ABSTRACT  10-11
第一章 前言  11-17
  1.1 语音增强简介  11-12
  1.2 子空间语音增强算法的发展现状  12-15
  1.3 语音增强算法在语音识别中的应用  15
  1.4 本文的工作  15-17
第二章 子空间语音增强算法  17-27
  2.1 基于奇异值分解(SVD)的语音增强算法  17-19
    2.1.1 基于SVD 的最优估计  17-18
    2.1.2 有色噪声环境下算法的改进  18-19
  2.2 基于特征值分解(EVD)的语音增强算法  19-22
    2.2.1 时域约束估计器(TDC)  19-20
    2.2.2 频域约束估计器(SDC)  20-22
    2.2.3 基于SVD 与EVD 语音增强算法间的关系  22
  2.3 有色噪声环境下算法的改进  22-25
    2.3.1 信号、噪声分类选择KLT 算法  22-23
    2.3.2 自适应KL 变换方法  23
    2.3.3 基于广义特征值分解(GEVD)的算法改进  23-25
  2.4 基于人耳听觉掩蔽效应的子空间语音增强算法  25-26
  2.5 小结  26-27
第三章 基于子空间的频域约束估计改进算法  27-47
  3.1 感知加权改进的时域约束估计器  27-29
    3.1.1 感知加权技术  27-28
    3.1.2 感知加权准则下的时域约束估计器  28-29
  3.2 频域约束估计器的改进算法  29-35
    3.2.1 白噪声环境下频域约束估计理论  29-31
    3.2.2 有色噪声环境下频域约束估计理论的改进  31-34
    3.2.3 最优频域约束估计器的统一形式  34-35
  3.3 感知加权改进的频域约束估计器  35-36
  3.4 子空间语音增强算法的实现  36-39
    3.4.1 协方差矩阵的估计算法  36-38
    3.4.2 拉格朗日乘子的确定  38
    3.4.3 信号子空间秩的确定  38-39
  3.5 实验结果与性能分析  39-46
    3.5.1 实验设置  40-41
    3.5.2 评价方法  41-42
    3.5.3 实验结果与分析  42-46
  3.6 小结  46-47
第四章 基于最优滤波和最小统计的噪声估计改进算法  47-62
  4.1 基于加权最小统计的噪声谱估计算法  47-54
    4.1.1 最小统计和最优滤波的噪声谱估计算法  48-49
    4.1.2 加权最小统计的改进算法  49-51
    4.1.3 实验及性能比较  51-54
  4.2 基于最优滤波和能量最小的噪声自相关估计算法  54-59
    4.2.1 模型的建立  55
    4.2.2 最优短时平滑滤波  55-56
    4.2.3 能量统计最小准则  56-57
    4.2.4 算法实现  57-58
    4.2.5 实验  58-59
  4.3 频域噪声谱估计算法在子空间算法中的应用  59-61
  4.4 小结  61-62
第五章 子空间语音增强在语音识别中的应用  62-73
  5.1 稳健语音识别技术发展现状  62-64
    5.1.1 鲁棒的语音特征  62-63
    5.1.2 噪声环境下的模型补偿  63
    5.1.3 基于语音增强的语音识别系统  63-64
  5.2 常用的特征参数  64-66
  5.3 子空间语音增强算法对特征提取的影响  66-70
  5.4 噪声环境下语音识别系统的性能分析  70-72
  5.5 小结  72-73
结束语  73-75
参考文献  75-80
附录A 子空间语音增强算法中最优估计器的求解  80-82
  1. TDC 估计器的求解  80
  2. SDC 估计器的求解  80-82
附录B Lyapunov 方程的解  82-85
  1、直接法  82-83
  2、数值解法  83-85
作者简历 攻读硕士学位期间完成的主要工作  85-86
致谢  86

相似论文

  1. OFDM系统信道估计技术研究,TN919.3
  2. 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
  3. 数字助听器中语音增强技术的研究,TN912.35
  4. 线性算子广播信道,TN911.22
  5. 基于子空间的MIMO-OFDM信道估计算法设计与实现,TN919.3
  6. 单通道语音增强算法的研究,TN912.35
  7. 基于稀疏非负矩阵分解的图像检索,TP391.41
  8. 多管阵列定向语音增强系统的研制,TN912.35
  9. 废杂铜冶炼过程控制系统的设计与实现,TP273
  10. 基于听觉侧抑制的滤波算法研究,TN911.72
  11. 可变光照和遮挡条件下的人脸识别技术研究及其应用,TP391.41
  12. 基于子空间的小型无人旋翼机的系统辨识研究,V275.1
  13. 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
  14. 贝叶斯框架下的图像显著性检测,TP391.41
  15. 复杂环境下语音增强方法研究,TN912.35
  16. 高光谱影像混合像元分解技术研究,TP751
  17. 基于子空间辨识的LQG基准控制性能评价,TP273
  18. 基于子空间方法的人脸识别技术研究,TP391.41
  19. 基于最大后验概率与子空间学习的二维人脸变换,TP391.41
  20. 人耳及人脸融合的多模态身份识别,TP391.41
  21. 人脸识别技术研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com