学位论文 > 优秀研究生学位论文题录展示
基于分数傅立叶变换的语音增强算法研究
作 者: 丁祝高
导 师: 于凤芹
学 校: 江南大学
专 业: 检测技术与自动化装置
关键词: 语音增强 分数傅立叶变换 噪声估计 谱减法
分类号: TN912.35
类 型: 硕士论文
年 份: 2008年
下 载: 171次
引 用: 1次
阅 读: 论文下载
内容摘要
语音信号由于经常受到环境噪声的干扰和污染,对通信过程会产生一定影响,因此对含噪语音信号进行去噪处理,以改善语音质量,提高语音信号的清晰度和可懂度,增强语音处理系统的性能已变得很有必要。传统语音增强算法主要是基于语音的时域和频域特性,分别在时域、频域对其进行处理。本文主要对基于分数傅立叶变换的语音增强算法进行了研究,对语音信号在分数阶域进行增强处理。分数阶域的语音增强包括谱减模型选取、最佳变换阶次确定、端点检测和噪声谱估计等内容。首先研究了分数阶域的最优滤波算子原理和传统谱减算法,在此基础上选取多组不同变换阶次下的分数阶域功率谱特性作为估计对象,实现特定阶次下对原纯净语音功率谱估计。在分数阶谱减过程中,利用改进的自适应参数调节方法实现对噪声谱的有效估计,从而达到谱减目的。仿真结果表明,在关于变换阶次的局部区间内存在着某最佳变换阶次,其增减效果明显优于传统谱减法。其次在特定变换阶次基础上,将功率谱估计推广至整个分数阶域,对语音和噪声的分数阶功率谱特性进行Gauss分布统计分析,并进一步修改传统谱减模型;同时以均方误差为准则,在其最小情况下确定最佳变换阶次,实施该变换阶次下的分数傅立叶变换,提取功率谱幅值特性进行噪声估计处理,最后插入相位系数,实现语音和噪声在分数阶域上的最佳分离。对谱减过程中涉及到的噪声估计,本文提出了一种分数阶域的噪声谱估计算法,在分数阶域通过对语音帧和噪声帧的准确判断达到对噪声功率谱的有效估计。噪声帧判别通过分数阶域的端点检测实现,该算法在分数傅立叶变换高分辨率计算基础上,通过调节变焦因子,实时显示帧信号的分数阶域局部谱特征,计算帧信号功率谱中的峰值-副峰比,与判决门限进行比较,从而灵活确定语音帧和噪声帧。检测出噪声帧后,对噪声功率谱进行迭代估计处理。仿真结果表明,最佳变换阶次下的分数阶谱减能有效抑制背景噪声,提高语音性能。最后,鉴于噪声估计的经验性模态假设,虽然在自相关基础上提高了检测效率,但不够稳定。当噪声谱统计值大于当前语音帧的谱幅值时,所得功率谱估计值将会丢失较多原始语音信息,并伴有音乐噪声的产生,影响听觉效果。本文在神经网络算法的基础上,利用最佳逼近准则进一步对分数阶域的功率谱估计加以改进,提出了一种基于神经网络的分数阶谱减系数最佳逼近算法,对含噪语音功率谱进行最佳逼近,达到去噪目的。该方法在噪声谱估计基础上,能进一步抑制音乐噪声的产生,具有较好的增强效果。
|
全文目录
摘要 3-4 ABSTRACT 4-8 第一章 绪论 8-12 1.1 课题的提出 8 1.2 国内外研究现状 8-10 1.2.1 语音增强的研究现状概述 8-9 1.2.2 分数傅立叶变换的研究现状概述 9-10 1.3 本文主要工作内容 10-11 1.4 论文结构 11-12 第二章 分数傅立叶变换的定义及基本性质 12-18 2.1 连续分数傅立叶变换的定义与性质 12-15 2.1.1 分数傅立叶域与分数傅立叶变换定义 12-13 2.1.2 分数傅立叶变换的逆变换 13-14 2.1.3 分数傅立叶变换的性质 14-15 2.2 离散分数傅立叶变换的定义及其数值计算 15-17 2.2.1 离散分数傅立叶变换的定义 15-16 2.2.2 离散分数傅立叶变换的计算 16-17 2.3 本章小结 17-18 第三章 基于分数阶域最优滤波的谱减增强算法 18-28 3.1 含噪语音的滤波模型 18-19 3.2 传统的语音增强方法 19-21 3.2.1 时域方法 19 3.2.2 频域方法 19-20 3.2.3 噪声功率谱估计 20-21 3.3 基于特定阶次下的分数阶域谱减最优滤波 21-24 3.3.1 分数阶域最优滤波算子构造 21-22 3.3.2 基于特定阶次下的分数阶域最优谱减滤波 22-24 3.4 仿真实验与结果分析 24-27 3.5 本章小结 27-28 第四章 分数阶域谱减算法中最佳变换阶次的确定 28-42 4.1 基于 Gauss 分布的分数阶谱减模型 28-31 4.2 MMSE 准则下的最佳变换阶次 31-32 4.3 分数阶域噪声谱估计 32-36 4.3.1 基于分数阶域局部谱特征的端点检测 33-35 4.3.2 噪声谱估计算法流程 35-36 4.4 仿真实验与结果分析 36-41 4.5 本章小结 41-42 第五章 基于神经网络的分数阶谱减系数最佳逼近算法 42-56 5.1 神经网络介绍 42-45 5.1.1 BP 网络结构 43-44 5.1.2 BP 算法原理 44-45 5.2 基于神经网络的分数阶域幅值系数逼近 45-48 5.2.1 幅值和相位系数提取 45-46 5.2.2 幅值系数归一化处理 46 5.2.3 分数阶域幅值系数逼近流程 46-48 5.3 仿真实验与结果分析 48-54 5.4 本章小结 54-56 第六章 总结与展望 56-58 6.1 论文工作总结 56 6.2 下一步工作展望 56-58 致谢 58-60 参考文献 60-66 附录:作者在攻读硕士学位期间发表的论文 66-68 附录:部分程序清单 68-73
|
相似论文
- 基于FRFT的扩展频谱信号特性分析,TN911.6
- 基于小波变换的语音信号去噪及其DSP算法实现,TN912.3
- 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
- 数字助听器中语音增强技术的研究,TN912.35
- 单通道语音增强算法的研究,TN912.35
- 多管阵列定向语音增强系统的研制,TN912.35
- 基于听觉侧抑制的滤波算法研究,TN911.72
- 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
- 复杂环境下语音增强方法研究,TN912.35
- MELPe语音编码关键技术研究,TN912.3
- 光学计算全息实现数字图像加密技术研究,TP309.7
- 基于Gamma Test的最小二乘支持向量机参数在线优化方法,TP18
- 基于加权分数傅立叶变换的双弥散信道内信号波形设计,TN911.7
- 广义加权类离散分数傅立叶变换及其在数字水印上的应用,TP309.7
- 基于随机分数傅立叶变换的自适应水印算法,TP309.7
- 分数傅立叶变换之间的关系,TN911.7
- 距离选通激光成像数据处理方法研究,TN249
- 阵列语音增强算法的研究及实现,TP301.6
- 噪声环境下的说话人识别研究,TP391.42
- 麦克风阵列语音增强算法研究,TN912.3
- 基于混沌理论的加密算法的分析与研究,TP309.7
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com
|