学位论文 > 优秀研究生学位论文题录展示
基于自适应谱估计的语音增强算法研究及应用
作 者: 闵姝君
导 师: 田岚
学 校: 山东大学
专 业: 信号与信息处理
关键词: 语音增强 自适应谱估计 谱减法 MMSE 电子耳蜗
分类号: TN912.35
类 型: 硕士论文
年 份: 2011年
下 载: 60次
引 用: 0次
阅 读: 论文下载
内容摘要
在实际环境中,由于背景噪声的存在,语音信号总是难免受到噪声的影响,噪声的存在导致原始语音信号的信噪比下降,可懂度降低。随着背景噪声进一步增大,原始语音信号甚至会被背景噪声淹没,导致原始语音信号无法分辨。而噪声对原始语音信号的污染将进一步影响后端语音信号处理的性能。语音增强是语音信号处理领域一项非常重要的技术,是解决噪声污染信号的有效方法。语音增强的目的是从带噪语音信号中尽可能地提取出原始纯净语音信号,以起到抑制背景噪声,提高语音信号信噪比和可懂度的作用。由于噪声来源众多,导致语音增强的方法很多,但始终没有一种增强方法适用于各种噪声。本文对一些典型算法进行了深入的研究。文中首先介绍了语音增强的研究背景,研究历史和现状,介绍了语音信号特性和噪声特性以及语音增强结果的主客观评价标准。分别讨论了基于短时谱估计的语音增强方法,基于小波和小波包变换的语音增强方法及基于子空间的增强方法的基本理论。噪声估计的准确性对语音增强的效果有很大影响,目前噪声估计方法根据是否进行语音活性检测大致分为两类。本文中对噪声估计方法也进行了详细的论述。本文在深入研究基于短时谱估计的语音增强方法的基础上,利用人耳的语音感知特性,又提出了自适应谱估计的方法,对谱减法和最小均方误差估计方法进行了相应的改进。首先对采集的带噪语音信号功率谱进行Bark子带划分,并在每个Bark子带中根据信噪比的变化进行增强系数的自适应调节,使各子带噪声更均衡地去除。仿真结果表明,改进后的增强算法在提高语音的信噪比和可懂度,减小“音乐噪声”方面较改进前的增强方法有明显提高。电子耳蜗通过将声音信号转化为电信号,刺激耳聋患者的听觉神经纤维产生听觉来帮助耳聋患者恢复部分听力。该技术在安静环境下效果较好,但在噪声环境下效果迅速恶化,因此为了提高电子耳蜗的抗噪性能,将本文的算法应用到电子耳蜗ACE合成前端,结果表明,仿真得到的CI合成音感知更好更清晰。
|
全文目录
中文摘要 8-9 ABSTRACT 9-11 符号说明 11-13 第一章 绪论 13-16 1.1 语音增强的研究意义 13 1.2 语音增强的研究历史及现状 13-14 1.3 语音增强技术的应用 14 1.4 本文的研究内容和结构安排 14-15 1.5 本章小结 15-16 第二章 语音增强常用方法概述 16-40 2.1 语音信号特性 16 2.2 噪声特性及分类 16-17 2.3 人耳听觉感知的特性 17-18 2.4 语音增强算法的性能评价 18-19 2.5 基于短时谱估计的语音增强方法 19-30 2.5.1 维纳滤波法 20-22 2.5.2 谱减法 22-25 2.5.3 最小均方误差估计法(MMSE) 25-27 2.5.4 增益函数的软判决改进 27-30 2.5.5 小结 30 2.6 基于小波和小波包变换的语音增强方法 30-36 2.6.1 小波分解理论 31-32 2.6.2 小波变换在语音增强中的应用 32-33 2.6.3 小波包变换理论及其在语音增强中的应用 33-36 2.7 基于子空间的语音增强方法 36-39 2.8 本章小结 39-40 第三章 噪声估计算法及改进 40-50 3.1 基于语音活性检测(Voice Activity Detection,VAD)的噪声估计方法 40-42 3.2 基于最小值跟踪的噪声估计算法 42-45 3.3 基于最小控制递归平均(MCRA,Minima Controlled RecursiveAveraging)的噪声估计 45-47 3.4 改进的最小控制递归平均(IMCRA,Improved Minima ControlledRecursive Averaging)噪声估计法 47-49 3.5 本章小结 49-50 第四章 自适应谱估计增强算法及其在电子耳蜗中的应用 50-69 4.1 语音信号的多频带分析 50-51 4.2 自适应变阶谱减法 51-59 4.3 自适应变阶MMSE方法 59-66 4.4 自适应谱估计算法在电子耳蜗中的应用 66-68 4.5 本章小结 68-69 第五章 结束语 69-70 参考文献 70-74 致谢 74-75 攻读学位期间发表的学术论文 75-76 学位论文评阅及答辩情况表 76
|
相似论文
- 基于小波变换的语音信号去噪及其DSP算法实现,TN912.3
- 较低水平控制性降压对脊柱手术病人术后认知功能的影响,R614
- 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
- 视觉事件相关电位P300在老年抑郁症临床特征评定中的作用,R749.41
- 数字助听器中语音增强技术的研究,TN912.35
- 单通道语音增强算法的研究,TN912.35
- 多管阵列定向语音增强系统的研制,TN912.35
- 基于听觉侧抑制的滤波算法研究,TN911.72
- 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
- 复杂环境下语音增强方法研究,TN912.35
- 基于导频的MIMO-OFDM系统信道估计技术研究,TN919.3
- P300和MoCA量表在诊断脑梗死后认知障碍中的价值,R743.3
- 电针头穴与电针头穴加辩证配穴治疗轻度认知障碍的临床疗效评价,R246.6
- 头电针“通督调髓”法治疗轻度认知功能障碍的临床随机对照研究,R246.6
- LTE上行链路均衡的研究与实现,TN929.5
- 基于DFT的OFDM系统的MMSE信道估计研究,TN919.3
- MIMO检测技术仿真与FPGA实现,TN791
- TD-LTE系统分布式MIMO信道估计方法研究,TN929.5
- 基于MMSE-BDFE联合检测算法的研究,TN929.533
- 认知MIMO-OFDM的自适应空间资源管理,TN919.3
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com
|