学位论文 > 优秀研究生学位论文题录展示

基于空域滤波的语音分离研究

作 者: 汪健
导 师: 王建英
学 校: 西南交通大学
专 业: 通信与信息系统
关键词: 语音分离 麦克风阵列 稀疏分解 波束形成 稳健性
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 25次
引 用: 1次
阅 读: 论文下载
 

内容摘要


现实生活中,人类能够在复杂的环境下将注意力集中于感兴趣目标的说话内容,语音分离的目的就是为了让计算机也具备这种能力,即在众多说话人背景下提取出感兴趣的一个或多个说话人的语音。麦克风阵列在时域和频域的基础上增加了空间域,为语音分离算法提供了一个新的思路,就是根据声源空间位置的不同对不同声源进行分离。本文就是按这个思路进行语音分离算法的研究,主要工作概括如下:第一,分析了语音信号的特性和声波传播特性,在传统阵列信号处理的基础上,研究了麦克风均匀线性阵列的近场、远场信号模型。第二,针对基于麦克风阵列的高分辨率参数估计(如MUSIC)和波束形成参数估计(如MVDR)方法在抗噪性方面的不足,利用阵列信号的稀疏性将信号稀疏分解算法应用于声源定位,通过实验仿真验证了该算法在低信噪比情况下有较好的鲁棒性,而且能够对相干信源进行定位估计;基于稀疏分解的声源定位算法是通过不同的方位参数建立原子库,并通过全局搜索寻找最佳原子,这样导致了该算法复杂度较高,计算量大,针对这一问题,使用基于近场扇区划分的匹配追踪算法,大大的减少了MP分解算法的计算量,为MP分解算法应用于实时系统提供了可能。第三,研究了近场自适应波束形成算法,使用麦克风阵列近场模型将传统MVDR波束形成算法应用于近场环境,针对MVDR波束形成算法稳健性方面的不足,研究了近场稳健MVDR波束形成(RCB)算法,使得MVDR波束形成算法具有对导向矢量误差和有限样本效应的双重鲁棒性。第四,结合声源定位算法和波束形成算法通过使用MATLAB仿真演示语音分离效果。

全文目录


摘要  6-7
Abstract  7-11
第1章 绪论  11-14
  1.1 本文的研究背景及意义  11-12
  1.2 相关技术研究现状  12-13
  1.3 本文的主要工作和内容安排  13-14
第2章 麦克风阵列模型分析  14-20
  2.1 语音信号特性与声波传播模型分析  14-16
    2.1.1 语音信号特性  14-15
    2.1.2 声波传播模型分析  15-16
  2.2 窄带阵列信号处理模型  16-17
  2.3 麦克风阵列处理模型  17-19
    2.3.1 近场与远场  17-18
    2.3.2 麦克风均匀线阵近场模型  18-19
  2.4 小结  19-20
第3章 基于稀疏分解的声源定位算法研究  20-39
  3.1 引言  20
  3.2 信号稀疏分解概述  20-23
    3.2.1 稀疏分解基础  20-21
    3.2.2 匹配追踪算法(Matching pursuit)  21-23
  3.3 基于MP分解的近场声源定位估计  23-33
    3.3.1 原子库  23-26
    3.3.2 算法描述  26-28
    3.3.3 仿真实验  28-33
  3.4 扇区匹配算法  33-38
    3.4.1 扇区匹配算法设计  33-34
    3.4.2 仿真实验  34-38
  3.5 小结  38-39
第4章 近场自适应波束形成算法  39-54
  4.1 引言  39
  4.2 常见波束形成器  39-41
    4.2.1 近场常规波束形成  39
    4.2.2 近场MVDR波束形成  39-40
    4.2.3 仿真实验  40-41
  4.3 稳健近场自适应波束形成算法  41-49
    4.3.1 近场样本协方差矩阵求逆法  41-42
    4.3.2 对角加载法  42
    4.3.3 近场稳健Capon波束形成方法  42-44
    4.3.4 仿真实验  44-49
  4.4 语音分离仿真实验  49-53
  4.5 小结  53-54
总结与展望  54-56
致谢  56-57
参考文献  57-61
攻读硕士学位期间发表的论文及科研成果  61

相似论文

  1. WiMAX系统中智能天线技术的应用研究,TN821.91
  2. 多载波CDMA的信道编码与信道估计技术的研究,TN929.533
  3. 声学计算机键盘原理研究与实现,TP334.23
  4. 新准则下公允价值计量对会计稳健性影响的研究,F233
  5. 债务结构对各行业会计稳健性影响的实证研究,F224
  6. 宽带数字波束形成算法研究,TN957
  7. 数字助听器中汉语语音处理及语音增强的研究,TN912.3
  8. 压缩感知中信号重构算法的研究,TN911.6
  9. 基于稀疏分解的医学图像去噪,TP391.41
  10. 脑部CT图像的压缩应用,TP391.41
  11. 中国民营上市公司债务融资与会计稳健性的关系研究,F275
  12. 协同通信中的中继协作策略研究,TN92
  13. 基于自适应阵列天线的抗干扰技术研究,TN911.4
  14. 分布式麦克风阵列跟踪算法研究,TN912.3
  15. 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
  16. 基于DDS的发射数字波束形成技术研究,TN741
  17. 数字波束形成天线以及波束切换天线研究,TN820
  18. DBF权重处理电路的设计与实现,TN957.51
  19. 复杂环境下语音增强方法研究,TN912.35
  20. 步进频率SAR超分辨成像技术研究,TN957.52
  21. DBF阵列幅相误差校准及其稳健性算法,TN820

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com