学位论文 > 优秀研究生学位论文题录展示

复杂环境下语音增强方法研究

作　者: 刘凤增
导　师: 李国辉
学　校: 国防科学技术大学
专　业: 系统工程
关键词: 语音增强小波阈值去噪最优改进对数谱幅度估计(OM-LSA) 基于HMM的语音增强语音分离
分类号: TN912.35
类　型: 硕士论文
年　份: 2011年
下　载: 78次
引　用: 0次
阅　读: 论文下载

内容摘要

语音是人们交流和通讯的主要方式之一,但语音信号往往不可避免地被噪声污染。带噪语音会使人的听觉感受变得糟糕,甚至让人难以捕获其所带的语音信息。在语音编码。语音识别。说话人识别等系统中,噪声也会严重影响应用的效果。因此,对语音进行增强十分有必要。目前,语音增强的效果还不能达到人们的要求,主要问题有增强语音中存在着残留噪声;算法不具有普遍性,只能处理特定类型的噪声;计算复杂度较高等。针对这些问题,本文研究复杂环境下的语音增强算法。研究的目标是使算法能够适应多种噪声类型且噪声特征随时间变化剧烈的复杂环境,提高增强效果,减少残留噪声,并改善算法的计算复杂度。本文主要的工作和创新点有:τ1υ对语音增强算法进行了全面系统的总结分析。将单通道语音增强算法划分为基于线性滤波的方法。基于短时谱估计的方法。基于语音模型的方法。基于听觉掩蔽效应的方法以及语音增强新方法等五类进行了详细地分析,对各算法的特点和缺点。计算复杂度作了对比。简要介绍了双通道和多通道语音增强算法,并对语音增强的发展方向进行了讨论。τ2υ提出并实现了一种最优改进对数谱幅度估计τOM-LSA,Optimally Modified Log-Spectral Amplitude Estimator)和小波阈值去噪结合的语音增强方法,并实验验证了算法的有效性。针对OM-LSA算法中存在的残留噪声,利用小波阈值去噪法对残余噪声进行处理,提出了估计残余噪声的方法。首先对原始带噪语音进行小波分解估计出原始噪声方差,再结合语音不存在时的增益函数,得到了准确的残留噪声估计。给出了OM-LSA和小波阈值去噪结合的语音增强算法过程,并进行了实现。利用专门的语音增强测试数据库进行大量数据实验,结果表明,提出的算法有效地去除了OM-LSA算法的残留噪声,在分段信噪比和对数谱失真等指标评价上有较大的提高。τ3υ提出了并实现了基于HMMτHidden Markov Modelυ融合语音分离的语音增强方法,并实验验证了算法的有效性。已有的两种基于HMM的语音增强算法是用于平稳噪声的MAPτMax A Posteriorυ语音估计算法和用于非平稳噪声的MMSE(Minimum Mean-Square Error)语音估计算法,两种算法计算量都较大,且前者不能处理非平稳噪声。针对这些缺点,借鉴语音分离算法,设计了基于HMM融合语音分离的语音增强算法。首先对带噪语音在语音模型和噪声模型下的混合状态进行解码,然后利用语音分离方法进行语音估计。实现了算法,对不同噪声类型和信噪比下的大量带噪语音数据进行了实验,并对结果进行了客观指标评价。结果表明,算法能够有效地去除平稳噪声和非平稳噪声,PESQ (PerceptualEvaluation of Speech Qualityυ得分评价有较大的提高,算法时间得到了控制。

全文目录

摘要  9-11
ABSTRACT  11-13
第一章绪论  13-22
  1.1 研究问题的提出  13-14
  1.2 语音增强的研究基础  14-17
    1.2.1 语音增强的研究历史  14-15
    1.2.2 语音?听觉及噪声特性  15
    1.2.3 语音数字信号处理技术  15-17
  1.3 主要研究内容及贡献  17-19
    1.3.1 研究范畴  17
    1.3.2 研究思路  17-18
    1.3.3 主要工作及贡献  18-19
  1.4 本文组织结构  19-22
第二章语音增强相关研究工作  22-34
  2.1 单通道语音增强方法  22-28
    2.1.1 基于线性滤波的方法  22-23
    2.1.2 基于短时谱估计的方法  23-25
    2.1.3 基于语音模型的方法  25-26
    2.1.4 基于听觉掩蔽的方法  26-27
    2.1.5 语音增强新方法  27-28
  2.2 单通道语音增强方法总结  28-29
  2.3 双通道和多通道语音增强方法  29-33
    2.3.1 双通道语音增强算法  29-30
    2.3.2 多通道语音增强方法  30-33
  2.4 本章小结  33-34
第三章 OM-LSA 和小波阈值去噪结合的语音增强方法  34-55
  3.1 问题建模和语音估计  35-39
    3.1.1 问题建模  35-36
    3.1.2 统计模型  36
    3.1.3 语音估计  36-39
  3.2 语音存在概率?噪声及先验信噪比估计  39-44
    3.2.1 语音存在概率估计  39-43
    3.2.2 噪声估计  43-44
    3.2.3 先验信噪比估计  44
  3.3 OM-LSA 和小波阈值去噪结合的语音增强  44-49
    3.3.1 问题提出及解决思路  44-45
    3.3.2 算法过程  45-49
  3.4 实验及结果分析  49-54
    3.4.1 评价指标  49-51
    3.4.2 实验设计  51
    3.4.3 结果分析  51-54
  3.5 本章小结  54-55
第四章基于HMM 融合语音分离的语音增强方法  55-72
  4.1 HMM 构建  55-58
    4.1.1 HMM 结构选择  55-56
    4.1.2 HMM 建模过程  56-58
  4.2 基于HMM 的语音估计  58-62
    4.2.1 高斯平稳噪声下的语音估计  58-60
    4.2.2 非平稳噪声下的语音估计  60-62
    4.2.3 两种语音估计算法的比较  62
  4.3 基于HMM 融合信号分离的语音增强  62-65
    4.3.1 混合状态解码  62-64
    4.3.2 融合语音分离的语音估计  64
    4.3.3 算法总结  64-65
  4.4 实验及结果分析  65-71
    4.4.1 算法实现  65-66
    4.4.2 增强效果分析  66-68
    4.4.3 状态数的影响  68-70
    4.4.4 大量数据实验及客观评价  70-71
  4.5 小结  71-72
第五章总结与展望  72-74
  5.1 总结  72-73
  5.2 展望  73-74
致谢  74-76
参考文献  76-80
作者在学期间取得的学术成果  80-81
附录A 主要数学符号列表  81-82
附录B 英文缩写词对照表  82

复杂环境下语音增强方法研究

内容摘要

全文目录

相似论文