学位论文 > 优秀研究生学位论文题录展示
基于麦克风阵列的语音增强和分离方法研究
作 者: 李万龙
导 师: 刘琚
学 校: 山东大学
专 业: 通信与信息系统
关键词: 语音增强 语音分离 麦克风阵列 独立分量分析 卷积混叠 频域盲反卷积 顺序不确定性
分类号: TN912.3
类 型: 硕士论文
年 份: 2008年
下 载: 346次
引 用: 0次
阅 读: 论文下载
内容摘要
环境噪声和竞争说话者的干扰是语音通信过程中常见的干扰情况。人的听觉系统可以在嘈杂的多个讲话者的环境中区分和跟踪自己感兴趣的语音信号,并分辨出自己所需要的声音,这种分辨能力是人体内部语音理解机理所特有的一种感知能力,也就是人类的语音分离的能力,称为“鸡尾酒会效应”。然而,现有的语音处理系统无法做到这一点,其性能受到噪声和竞争说话者语音的严重影响。例如,当前的语音识别系统对纯净语音能够达到很高的识别率,但是当语音被噪声污染时,系统性能会急剧下降。语音信号增强和分离是抑制噪声干扰、还原原始语音信号的一种有效途径。近年来,基于麦克风阵列的语音增强技术在车载通信、多媒体会议以及机器人控制系统中得到广泛的应用。和单个麦克风相比,麦克风阵列在时频域的基础上增加了一个空间域,对来自空间不同方位的信号进行空时频联合处理。因此,麦克风阵列可以弥补单个孤立的麦克风在噪声处理、声源定位跟踪、语音提取分离等方面的不足,能够广泛应用于各种具有嘈杂背景的语音通信环境(如会场、多媒体教室、助听器、车载免提电话、战场等),以提高语音通信质量。麦克风阵列研究是阵列信号处理的新方向,具有广阔的市场应用前景。盲信号分离,是指在不知源信号和传输信道参数的情况下,根据输入源信号的统计特性,仅由观测信号恢复出各个源信号的过程,它是实现语音分离的主流方法。独立分量分析(Independent Component Analysis,ICA),是在研究盲源分离过程中出现的一种新兴的盲分离技术,自其出现便成为信号处理、数值分析、统计及神经网络等领域中的热点研究问题,并在语音处理、生物医学信号处理、模式识别、特征提取、数据压缩、图像处理和电子通讯等方面获得了非常广泛的应用。到目前为止已经有诸多语音增强方法被提出,但是强噪环境下的语音增强仍是一个具有挑战性的课题;另外,卷积盲分离的研究对于语音分离的实际应用具有重大意义,频域盲分离是解卷积的行之有效的方法,然而顺序不确定性成为一个严重的问题。本论文重点对以上两个问题进行研究和探索。本论文对ICA的基本理论、麦克风阵列语音增强技术和卷积混叠语音信号的盲分离进行了详细介绍;对麦克风阵列信号处理技术在语音信号处理中的应用进行了分析和探讨,并针对当前语音增强和分离的研究现状,对强噪环境下基于麦克风阵列的语音增强和频域内盲反卷积的顺序不确定性问题进行了研究和探索。主要进行了以下解决方案的研究:1.提出了基于ICA的麦克风阵列语音增强方法。方案中,我们首先利用ICA对严重污染的语音信号进行分析,提取出相对纯净的目标信号;然后通过后续的麦克风阵列语音增强系统(如维纳后滤波,GSC等),得到最后的增强信号。真实环境下的实验证明了该方法的有效性。2.提出了一种利用麦克风嵌套子阵列纠正频域反卷积的顺序模糊问题的方法。频域盲分离的顺序不确定性是一个严重的问题,如果顺序模糊不能得到正确的纠正,将导致算法性能下降,甚至解卷积失败。这里提出一种利用麦克风嵌套子阵列,结合DOA法和相关法纠正顺序模糊的方案。该方法能够得到更多的高可信度的DOA估计,在低频尤其如此;然后利用相关法对其余的频率点进行顺序调整。实验证明提出的方案具有较高的稳健性。应该指出的是,语音增强和卷积信号的频域盲分离研究中仍然存在着许多尚未解决的问题。论文最后对本课题的研究进行了总结和展望。
|
全文目录
中文摘要 8-10 ABSTRACT 10-12 符号说明 12-14 第一章 绪论 14-22 1.1 课题的研究背景和意义 14-15 1.2 麦克风阵列语音处理技术 15-18 1.3 语音盲分离模型 18-20 1.4 本论文的主要研究内容和贡献 20-21 1.5 论文结构 21-22 第二章 盲语音分离的基础 22-33 2.1 瞬时混叠盲分离-独立分量分析 22-28 2.1.1 ICA数学模型 22-23 2.1.2 ICA的约束条件和不确定性 23-24 2.1.3 经典ICA算法 24-27 2.1.4 FastICA算法 27-28 2.2 卷积混叠盲分离 28-32 2.2.1 卷积混叠的数学模型 29-30 2.2.2 反卷积算法 30-32 2.3 小结 32-33 第三章 基于ICA的麦克风阵列语音增强系统 33-49 3.1 引言 33-34 3.2 麦克风阵列语音信号处理基础 34-37 3.2.1 麦克风阵列 34 3.2.2 麦克风阵列的几何尺寸 34 3.2.3 语音信号的特性 34-35 3.2.4 噪声的特性 35-36 3.2.5 噪声场的空间相干性 36-37 3.3 经典的麦克风阵列语音增强方法 37-41 3.3.1 DS波束形成器 37-38 3.3.2 结合波束形成器和后滤波的语音增强算法 38-40 3.3.3 基于自适应波束形成器的麦克风阵列语音增强 40-41 3.4 一种基于ICA的麦克风阵列语音增强系统 41-44 3.4.1 对阵元接收信号进行ICA分析 42-43 3.4.2 基于ICA的麦克风阵列语音增强系统 43-44 3.5 实验结果及分析 44-48 3.6 小结 48-49 第四章 基于麦克风嵌套子阵列的频域盲反卷积算法 49-60 4.1 引言 49 4.2 现有的解决顺序不确定性的方法 49-54 4.2.1 相关法 50-51 4.2.2 DOA法 51-53 4.2.3 相关法和DOA法的比较 53-54 4.3 一种基于麦克风嵌套子阵列的频域反卷积算法 54-57 4.3.1 为什么利用嵌套子阵列? 54-56 4.3.2 结合DOA法和相关法进行顺序调整 56 4.3.3 基于麦克风嵌套子阵列的频域反卷积算法 56-57 4.4 实验结果及分析 57-59 4.5 小结 59-60 第五章 总结与展望 60-62 附录 语音数据库简介 62-64 参考文献 64-72 致谢 72-73 攻读硕士学位期间发表和投出的论文 73-74 学位论文评阅及答辩情况表 74
|
相似论文
- 声学计算机键盘原理研究与实现,TP334.23
- 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
- 数字助听器中语音增强技术的研究,TN912.35
- 罐底腐蚀声发射信号降噪研究,TH878
- 分布式麦克风阵列跟踪算法研究,TN912.3
- 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
- 用于金属磨粒检测系统的噪声消除算法研究,TP391.41
- 基于气味分析的设备异常检测方法研究,TB17
- 基于电话信道的声纹识别算法研究,TN912.34
- 复杂环境下语音增强方法研究,TN912.35
- 基于OMAP3530的麦克风阵列生命探测仪的设计与实现,TN912.2
- 基于独立分量分析的地震盲反褶积方法及应用研究,P631.4
- 基于独立分量分析和小波变换的钢丝绳缺陷信号提取,TG115.284
- 独立分量分析的重盲分离研究及其在机械故障诊断中的应用,TH165.3
- 基于盲源分离的肺音信号提取研究,TN911.72
- 基于数字拼写的视—听联合刺激诱发ERP研究,R318.0
- 基于听觉注意的认知脑—机接口研究,R318.0
- 多任务脑—机接口空域滤波与特征提取方法研究,TP11
- 基于非稳定性的独立分量分析及四种新稳定性测度方法,TP301.6
- MELPe语音编码关键技术研究,TN912.3
- 内燃机表面辐射噪声盲源分离技术研究,TK401
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|