学位论文 > 优秀研究生学位论文题录展示
语音通信中的非平稳噪声估计方法研究
作 者: 何玉文
导 师: 鲍长春
学 校: 北京工业大学
专 业: 信息与通信工程
关键词: 语音增强 非平稳噪声 隐马尔可夫模型 高斯混合模型 压缩域 自动电平控制
分类号: TN912.35
类 型: 硕士论文
年 份: 2013年
下 载: 31次
引 用: 0次
阅 读: 论文下载
内容摘要
现有单通道语音增强技术对平稳噪声的跟踪与消除能力较强,但对于现实生活中常见的非平稳噪声,往往会出现噪声估计不准确、噪声抑制效果较差的问题,因此非平稳噪声环境下的语音增强就成为实际应用中需要解决的一项课题。本论文的研究内容主要体现在以下几个方面:首先回顾隐马尔可夫模型(Hidden Markov Model, HMM)的基本原理和其在语音增强上的应用。其次,针对非平稳噪声环境提出了一种基于隐马尔可夫模型的语音增强方法。所提方法以激励能量和线谱频率参数(Line SpectrumFrequency, LSF)为特征,利用Baum-Welch算法分别训练纯净语音和噪声信号的自回归隐马尔可夫模型。在增强阶段,首先以归一化临界带功率谱为特征,利用高斯混合模型(Guassian Mixture Model, GMM)对背景噪声进行分类,而后利用纯净语音的HMM和对应类型噪声的HMM,在最小均方误差准则下估计语音和噪声的功率谱,并使用维纳滤波形式的谱增益函数对含噪语音进行增强。考虑到非平稳环境中训练集和测试集的差异性,提出了一种在线调整语音模型和噪声模型的方法。语音模型的能量调整采用迭代的期望最大化算法(ExpectationMaximization, EM);噪声模型的能量调整则利用的是模型训练过程中的能量重估方法,并以最小值控制的递归平均算法(Minima-Controlled RecursiveAveraging,MCRA)确定噪声能量调整的初始值。最后,为避免语音信号采集过程及语音增强等预处理模块对语音电平造成的影响,提出了一种网络端的压缩域自动电平控制(Automatic Level Control,ALC)方法。所提方法利用ITU-T P.56标准测定语音信号的实时电平,根据实时电平与目标电平的差异联合调整输入语音码流中的自适应码书增益和代数码书增益参数,从而达到将语音电平控制在听觉舒适范围内的目的。在国际电信联盟电信标准部(International Telecommunication Union,Telecommunication Standardization Sector, ITU-T)G.160标准下对语音增强算法进行性能测试。测试结果表明,与参考方法相比,本文提出的非平稳噪声估计方法能够较好的跟踪和处理非平稳噪声,噪声衰减量较大,收敛时间较短。自动电平控制的电平偏差在0.5dB以内,电平调整后语音的客观质量优于电平控制的参考算法。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-16 1.1 课题背景 10-13 1.1.1 语音增强背景介绍 10-13 1.1.2 自动电平控制背景介绍 13 1.2 研究目标 13 1.3 研究内容 13-14 1.4 论文结构 14-16 第2章 隐马尔可夫模型简介 16-26 2.1 HMM的基本元素 16-18 2.2 HMM基本问题 18-23 2.2.1 前向后向算法 19-21 2.2.2 Viterbi算法 21 2.2.3 Baum-Welch算法 21-23 2.3 HMM在语音增强中的应用 23-24 2.4 本章小结 24-26 第3章 基于隐马尔可夫模型的语音增强方法 26-56 3.1 信号模型 26-31 3.1.1 语音模型 27-29 3.1.2 噪声模型 29-30 3.1.3 含噪信号模型 30-31 3.2 模型训练 31-34 3.3 增强方法 34-46 3.3.1 噪声类型选择 35-38 3.3.2 基于最小均方误差的AR-HMM增强方法 38-40 3.3.3 能量调整 40-46 3.4 性能测试 46-54 3.4.1 白噪声环境下的性能测试方法 46-48 3.4.2 语音质量测试方法 48-49 3.4.3 有色噪声环境下性能测试方法 49-50 3.4.4 性能测试结果 50-54 3.5 本章小结 54-56 第4章 基于ITU-T G.722.2 的压缩域自动电平控制 56-78 4.1 G.722.2 编码器原理介绍 56-58 4.2 P.56 测量电平标准介绍 58-60 4.3 自动电平控制方法 60-66 4.3.1 判断ALC起始位置 61-64 4.3.2 码书增益调整 64-66 4.4 性能测试结果 66-77 4.4.1 电平偏差测试 67-68 4.4.2 客观语音质量测试 68-76 4.4.3 复杂度分析 76-77 4.5 本章小结 77-78 结论 78-80 参考文献 80-84 攻读硕士学位期间发表的学术论文 84-86 攻读硕士学位期间参加的科研项目 86-88 致谢 88
|
相似论文
- 网络语音传输丢包的恢复技术,TN912.3
- 领域实体属性及事件抽取技术研究,TP391.1
- 数字波导网格模型及语音网格参数估计,TN912.3
- 基于二值掩蔽和感知小波包变换的语音增强研究,TN912.35
- 基于视觉的人体行为检测识别研究,TP391.41
- 面向智能交通的视频车辆检测、跟踪和识别算法研究,TP391.41
- 隐马尔可夫模型在视频场景分析中的应用研究,TP391.41
- VHF频段信道模块的研制,TN924
- 基于组合及统计的图像型垃圾邮件检测研究,TP391.41
- 基于特征加权连续隐马尔可夫模型的故障诊断方法研究,TH165.3
- 基于压缩域的视频关键帧提取算法研究与应用,TP391.41
- 球麦克风阵列波束形成语音增强方法的研究,TN912.35
- 关于树上马尔可夫链场的若干强大数定律,O211.4
- 时空融合的视觉选择注意模型及其在MPEG压缩域应用研究,TP391.41
- 超宽带数字自动电平控制系统的研究,TN015
- 隐马尔可夫模型下基于通信流的隐组识别,TP301.6
- 无线传感器网络中的追击者—逃跑者跟踪问题研究,TP212.9
- 基于压缩域特征的视频检索技术研究,TP391.41
- 基于H.264/AVC压缩域的视频运动目标检测,TP391.41
- 数字助听器芯片中单通道语音增强算法的研究与实现,TN912.35
- 基于HMM的轴承故障诊断方法,TH165.3
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com
|