学位论文 > 优秀研究生学位论文题录展示
基于二值掩蔽和感知小波包变换的语音增强研究
作 者: 沈圆圆
导 师: 陶智
学 校: 苏州大学
专 业: 检测技术与自动化装置
关键词: 语音增强 二值掩蔽 感知小波包变换 清音增强 掩蔽效应
分类号: TN912.35
类 型: 硕士论文
年 份: 2011年
下 载: 44次
引 用: 0次
阅 读: 论文下载
内容摘要
在现实生活中,语音的传输不可避免地受到周围环境和传输媒介的影响。受干扰的语音信号不但会使人耳容易产生听觉疲劳,而且会严重降低语音编码、语音识别等语音信号处理系统的性能。为了消除噪声的影响,对语音增强技术的研究是非常有必要的。本文在对谱减类语音增强算法的研究基础上,提出了基于二值掩蔽和感知小波包变换的语音增强系统。主要工作包括:针对目前听觉掩蔽效应算法只考虑同时掩蔽效应的问题,将同时掩蔽效应和短时掩蔽效应相结合并提出了一种瞬时掩蔽因子,更符合人耳的听觉感知特性。将初步增强的语音信号与纯净语音信号之差表示为语音失真和残留噪声的叠加,定义代价函数将二者结合起来。根据残留噪声能量应低于掩蔽阈值的约束条件,将语音失真降至最低来优化增益函数,从而得到能够根据听觉掩蔽阈值自适应调整的最优谱减参数,进而实现语音增强。针对语音增强算法容易损失清音部分的问题,提出了一种基于二值掩蔽的清音增强方法。根据计算听觉场景分析,将带噪清音信号划分为若干时频单元,用训练好的二值掩蔽模型判断每个时频单元是语音主导还是噪声干扰主导,语音主导的时频单元将被保留,噪声干扰主导的时频单元将被去除。最后将增强后的清音部分与基于感知小波包变换增强的浊音部分合成,就得到了完整的增强语音。对本文方法进行了实验仿真,分别用主客观评价标准对增强语音进行了评价。结果表明,本文方法与常用算法相比,可以更好地去除背景噪声,抑制残留噪声,同时语音失真最小,有效地保护了清音。最后指出了本文方法中存在的缺点,并给出了解决的思路。
|
全文目录
中文摘要 4-5 Abstract 5-9 第一章 绪论 9-15 1.1 语音增强研究的背景及意义 9-10 1.2 语音增强研究的历史与现状 10-11 1.3 语音增强研究的难点分析 11-13 1.4 本文的主要研究工作及章节安排 13-15 1.4.1 本文的主要研究工作 13-14 1.4.2 本文的章节安排 14-15 第二章 语音增强的理论基础 15-22 2.1 语音信号的产生模型及特性 15-17 2.1.1 语音信号的产生模型 15-17 2.1.2 语音的特性 17 2.2 噪声的特性 17-18 2.3 人耳听觉特性 18-19 2.4 语音增强的主客观评价 19-21 2.4.1 客观评价标准 19-21 2.4.2 主观评价标准 21 2.5 本章小结 21-22 第三章 谱减类语音增强算法 22-27 3.1 功率谱减法 22-24 3.2 非线性谱减法 24 3.3 多带谱减法 24-26 3.4 本章小结 26-27 第四章 基于感知小波包变换的语音增强方法 27-47 4.1 引言 27 4.2 小波变换的基本原理 27-31 4.2.1 小波理论的提出 27-28 4.2.2 连续小波变换 28-29 4.2.3 离散小波变换 29-30 4.2.4 小波包变换 30-31 4.3 小波阈值去噪法 31-34 4.4 基于感知小波包变换的语音增强方法 34-46 4.4.1 感知小波包变换 34-39 4.4.2 听觉掩蔽阈值的计算 39-42 4.4.3 基于谱减参数最优化的时频感知语音增强 42-46 4.5 本章小结 46-47 第五章 基于二值掩蔽和感知小波包变换的语音增强研究 47-62 5.1 引言 47 5.2 二值掩蔽的理论及模型 47-59 5.2.1 最优二值掩蔽的理论基础 47-52 5.2.2 时频单元分割 52-53 5.2.3 特征向量提取 53-54 5.2.4 二值掩蔽模型 54-59 5.3 基于二值掩蔽和感知小波包变换的语音增强研究 59-61 5.3.1 二值掩蔽模型匹配 59 5.3.2 清音信号子带重构 59-60 5.3.3 清浊音合成 60-61 5.4 本章小结 61-62 第六章 实验结果及分析 62-69 6.1 实验结果 62-66 6.2 语音增强效果的主客观评价 66-68 6.2.1 客观评价 66-68 6.2.2 主观评价 68 6.3 本章小结 68-69 第七章 总结与展望 69-71 7.1 论文工作总结 69-70 7.2 对下一步工作的展望 70-71 参考文献 71-76 攻读硕士学位期间发表的论文 76-77 致谢 77-78
|
相似论文
- 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
- 数字助听器中语音增强技术的研究,TN912.35
- 单通道语音增强算法的研究,TN912.35
- 多管阵列定向语音增强系统的研制,TN912.35
- 基于听觉侧抑制的滤波算法研究,TN911.72
- 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
- 基于人耳掩蔽效应的谱减算法的研究与实现,TN912.3
- 复杂环境下语音增强方法研究,TN912.35
- 开放式办公室噪声源掩蔽效应及感知评价,TU243.2
- MELPe语音编码关键技术研究,TN912.3
- 基于子空间的语音增强算法研究,TN912.35
- 低信噪比下的语音增强方法研究,TN912.35
- 基于DM6446嵌入式平台的语音增强算法实现与优化,TN912.35
- 基于ARM的嵌入式语音识别的研究,TN912.34
- 非平稳环境下的语音增强算法研究,TN912.35
- 麦克风阵列语音增强技术研究,TN912.35
- 基于小波变换的语音增强及DSP实现,TN912.35
- 基于自适应谱估计的语音增强算法研究及应用,TN912.35
- 基于子带分解的分数傅里叶变换语音增强算法研究,TN912.35
- 基于TVAR和粒子滤波的语音增强方法研究,TN912.35
- 基于EMD方法的语音增强的研究,TN912.35
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com
|