学位论文 > 优秀研究生学位论文题录展示

有效提高语音可懂度的语音增强方法研究

作　者: 李娜
导　师: 鲍长春
学　校: 北京工业大学
专　业: 信息与通信工程
关键词: 语音增强统计模型语音可懂度语音失真噪声过估计
分类号: TN912.35
类　型: 硕士论文
年　份: 2013年
下　载: 41次
引　用: 0次
阅　读: 论文下载

内容摘要

现有语音增强方法在消除背景噪声、改善语音质量的同时，往往不能在低信噪比情况下有效提高语音的可懂度。为解决这一问题，本文首先对传统的统计模型方法进行改进研究，提出一种改进的β阶加权欧式失真测度（Improved β-orderWeighted Euclidean Distortion Measure, I-β-WEDM）幅度谱估计器，能够在较高信噪比环境有效提高语音质量。进一步，在研究现有语音增强方法对语音可懂度影响的基础上，结合对语音可懂度的相关影响因素的分析，提出了一种基于语音失真和噪声过估计受控的增强方法，能够有效提高低信噪比环境中的语音可懂度。本文的研究工作主要体现在以下几个方面：首先，对统计模型增强算法进行了深入研究。β阶最小均方误差估计器（β-order Minimum Mean Square Error, β-MMSE）可以通过估计器阶数的自适应选择控制噪声衰减量，但语音存在段的残留噪声较多；而WEDM估计器能够对谱峰谱谷分配不同的失真并有效抑制谱谷处的残留噪声，但不能根据需要控制噪声抑制量。结合两种估计器的优点，本文通过引入β阶WEDM形式的损失函数，并在临界带中利用子带信噪比更新估计器阶数，提出了一种改进的β阶WEDM（I-β-WEDM）语音增强方法。并且利用国际电信联盟标准部ITU-T（InternationalTelecommunication Union, Telecommunication Standardization Sector）G.160标准对上述方法进行了性能测试，测试结果表明，与传统方法相比，I-β-WEDM方法在有效抑制噪声的同时语音质量得到更大的提高。然后，本文研究了现有语音增强算法未能提高可懂度的原因，并对语音失真及噪声过估计对可懂度的影响进行了分析。根据研究结果及二值掩码（BinaryMask，BM）准则，本文通过对噪声估计和增益函数的调整，提出了一种基于语音失真和噪声过估计受控的语音增强算法（Constraints on Speech Distortion andNoise Over-estimation，CSDNO），以达到提高语音可懂度的目的。为了进一步抑制音乐噪声，根据不同程度的语音失真对可懂度影响的不同，对信噪比估计方法进行了修正，提出了一种改进的CSDNO方法（Improved CSDNO，ICSDNO）。本文所提方法有效地改善了低信噪比下增强语音的可懂度。最后，对基于CSDNO的增强算法进行了主客观的性能测试，包括G.160测试和语音可懂度测试两方面。G.160测试结果显示，与参考方法相比，CSDNO和ICSDNO方法语音电平损失较小，客观语音质量满足要求。语音可懂度测试分为基于频域加权分段信噪比（frequency-weighted SNR segmental，fwSNRseg）和分数清晰度指数（fractionalArticulationIndex，fAI）的客观测试和判断韵字测试（Diagnostic Rhyme Test，DRT）的主观测试两部分。测试结果显示，与参考方法相比，本文所提方法能够有效地减少语音失真，提高语音可懂度。另外，利用定点C语言实现了所提语音增强方法。

全文目录

摘要  5-7
Abstract  7-11
第1章绪论  11-19
  1.1 课题背景  11
  1.2 国内外研究现状  11-16
    1.2.1 语音增强算法研究现状  12-13
    1.2.2 语音可懂度研究现状  13-16
  1.3 研究目标  16
  1.4 研究内容  16-17
  1.5 论文结构  17-19
第2章改进的β阶WEDM增强算法  19-45
  2.1 引言  19-21
  2.2 贝叶斯估计器  21-26
    2.2.1 最小均方误差估计器  22-25
    2.2.2 加权欧式失真测度估计器  25-26
  2.3 改进的β阶WEDM增强算法原理  26-30
  2.4 自适应β值的计算方法  30-34
  2.5 G.160 测试方法  34-39
    2.5.1 白噪声环境下的测试方法  34-37
    2.5.2 有色噪声环境下的测试方法  37-39
  2.6 测试结果及分析  39-43
    2.6.1 白噪声环境下的测试结果  39-41
    2.6.2 有色噪声环境下的测试结果  41
    2.6.3 测试结果汇总  41-42
    2.6.4 增强信号语谱图对比  42-43
  2.7 本章小结  43-45
第3章基于语音失真和噪声过估计受控的增强方法  45-61
  3.1 基于CSDNO的语音增强方法  45-54
    3.1.1 引言  45-46
    3.1.2 最小值控制递归平均算法  46-49
    3.1.3 基于噪声过估计受控的噪声估计修正方法  49-52
    3.1.4 基于二值掩码的增益函数修正方法  52-54
  3.2 改进的CSDNO增强方法  54-59
  3.3 仿真实验结果  59-60
  3.4 本章小结  60-61
第4章基于CSDNO方法的性能测试及定点化  61-79
  4.1 G.160 性能测试结果  61-65
    4.1.1 白噪声环境下的测试结果  61-64
    4.1.2 有色噪声环境下的测试结果  64-65
  4.2 语音可懂度的测试  65-73
    4.2.1 客观测试  65-69
    4.2.2 主观测试  69-71
    4.2.3 测试结果总结  71-73
  4.3 定点化理论  73-75
  4.4 浮点及定点结果对比  75-76
  4.5 定点程序复杂度  76-77
  4.6 本章小结  77-79
结论  79-81
参考文献  81-85
攻读硕士学位期间所发表的学术论文  85-87
攻读硕士学位期间参加的科研项目和获奖情况  87-89
致谢  89

相似论文

基于二值掩蔽和感知小波包变换的语音增强研究,TN912.35
大规模水的动画和实时渲染技术,TP391.41
基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
大坝安全监测系统设计及数据分析,TV698.1
数字助听器中语音增强技术的研究,TN912.35
球麦克风阵列波束形成语音增强方法的研究,TN912.35
单通道语音增强算法的研究,TN912.35
针对链接语料的主题社区挖掘,TP391.1
多管阵列定向语音增强系统的研制,TN912.35
基于听觉侧抑制的滤波算法研究,TN911.72
嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
基于多水平统计模型的气象数据研究,P468.0
数字助听器芯片中单通道语音增强算法的研究与实现,TN912.35
机载GPS测量数据处理质量控制方法研究,P228.4
基于GIS/RS的土壤侵蚀动态变化研究,S157
基于OGC WPS标准的空间统计PSE研究及PSE-SDBI实现,TP393.09
网络入侵检测系统的关键技术研究与实践,TP393.08
低信噪比下的语音增强方法研究,TN912.35
基于MRF模型的SAR图像分割方法研究,TN957.52
非平稳环境下的语音增强算法研究,TN912.35
麦克风阵列语音增强技术研究,TN912.35