学位论文 > 优秀研究生学位论文题录展示

室内麦克风阵列声源定位算法研究和实现

作　者: 周峰
导　师: 陈雄
学　校: 复旦大学
专　业: 电路与系统
关键词: 麦克风阵列声源定位 TDOA 可控波束随机区域收缩
分类号: TN64
类　型: 硕士论文
年　份: 2009年
下　载: 714次
引　用: 6次
阅　读: 论文下载

内容摘要

随着多媒体技术的进一步发展,语音在接收和处理信息方面的应用重要性得到了广泛的关注,语音识别,语音增强,目标声源的定位等应用方兴未艾,而声源的定位是实现语音增强,语音识别的前提和基础,基于麦克风阵列的声源定位技术由于其广阔的应用前景得到了广泛的关注。在本论文中,我们致力于研究室内环境下的基于麦克风阵列的声源定位系统的研究和实现工作。在室内环境中,由于房间回响和背景的噪声的影响,麦克风阵列的性能受到了极大的限制,再者,由于硬件条件的限制,一些定位算法所需的计算量大,限制了其实时的应用。本文针对上述的两个问题,提出了自己的解决方案,并在实际环境中搭建了系统,采集了数据,验证了提出算法的有效性。鉴于预处理和语音活动检测对声源定位系统后续处理的重要性,首先我们介绍了滤波,加窗预处理操作,解释了简单但有效的语音活动检测算法:能量法和过零率法。基于时间到达差的(TDOA)的GCC-LMS两步定位方法由于其计算量小,因此在实际的系统中得到了广泛的应用。第一步的时延估计直接决定了定位的性能,我们在实际中发现,由于采集卡同步噪声的原因,虚假的零峰值导致了错误的时延估计,因此,我们对互功率谱滤波解决此问题。为了尽可能的削弱回响和噪声对时延估计的影响,我们采取了几个措施,1)减小搜索空间,按照麦克风的距离设置搜索区间,2)根据信噪比动态的调整权重函数的大小,仿真结果表明了这些措施的采用提高了在高噪声和回响环境中时延估计的准确度。另外,我们针对了采样率低的情况提出了对互相关函数的插值,提高了时延估计的空间分辨率。在TDOA的第二步中,目前广泛采用了最小二乘法(LMS),为了增强系统的可靠和稳健性,我们提出了一种轮流使用麦克风为参考麦克风,剔除误差较大的位置估计,对剩下的取平均,提高了位置估计的鲁棒性。另外,我们介绍了基于双曲线定位的平面几何法,并和最小二乘法(LMS)做了简要的对比。目前另一种广泛使用的声源定位方法是可控波束法(SRP),一步定位的可控波束法相对与两步定位的TDOA法,推迟了做决策的阶段,综合了所有的麦克风信息,具有更强的抗回响和噪声能力,而与之相随的代价是计算量大,难于实时处理。基于随机区域收缩(SRP-SRC)的可控波束法避免了全局的空间搜索,极大的减少了计算量,在论文中,我们改进了SRP-SRC方法,称之为SRP-RSRC方法,1)引入了塑形函数,提高了能量峰值和周围环境的对比度,2)设定一能量阈值,从能量大于此阈值的空间中选择能量最大的点,使SRP-RSRC算法具有更快的收敛速度,更小的计算量。另外,我们将卡尔曼滤波和预测和SRP-RSRC联合使用,使系统的跟踪性能更为稳定。最后,我们介绍了我们在室内环境中实现的系统的基本结构和软硬件的情况,并用实际中采集的数据对基于TDOA的两步GCC-LMS定位法和SRP-SRC,SRP-RSRC做了对比分析。

全文目录

目录  3-5
摘要  5-7
ABSTRACT  7-9
第一章绪论  9-21
  1.1 研究背景及意义  9-10
  1.2 应用领域  10-11
  1.3 国内外相关的研究和产品  11-13
  1.4 麦克风阵列研究分类  13-15
  1.5 麦克风阵列声源定位算法分类  15-19
  1.6 本论文的主要工作和创新点  19-20
  1.7 本文组织  20-21
第二章预处理和语音活动检测  21-27
  2.1 滤波去噪  21
  2.2 加窗  21-24
  2.3 语音活动检测  24-26
    2.3.1 短时能量和短时平均幅度  24-25
    2.3.2 短时平均过零率  25-26
    2.3.3 高阶累积量  26
  2.4 本章小结  26-27
第三章基于TDOA的声源定位方法  27-40
  3.1 GCC方法对时延的估计  27-30
  3.2 对GCC算法的改进  30-33
    3.2.1 引入互功率谱的滤波,避免位于零点的伪峰值  30-31
    3.2.2 限制互相关函数的搜索区间  31-32
    3.2.3 根据信噪比动态的调整权重函数的大小  32-33
    3.2.4 在采样率比较低的情况下引入插值  33
  3.3 GCC方法和改进后GCC方法的时延估计准确度对比  33-34
  3.4 最小二乘法  34-36
  3.5 改进的GCC-LMS算法  36-37
  3.6 几何法实现定位  37-39
  3.7 本章小结  39-40
第四章基于可控波束的声源定位方法  40-58
  4.1 远场可控波束方法介绍  40-42
  4.2 室内声源的可控波束方法介绍  42-44
  4.3 基于随机区域收缩的可控波束方法  44-52
    4.3.1 能量的峰值所在区域的不确定性空间  44-45
    4.3.2 基于随机区域收缩的可控波束方法  45-48
    4.3.3 对随机区域收缩方法的改进  48-51
    4.3.4 随机区域收缩方法的计算性能分析  51-52
  4.4 基于卡尔曼滤波和预测的运动声源跟踪  52-56
    4.4.1 卡尔曼滤波和预测  52-53
    4.4.2 声源运动模型的建立  53-55
    4.4.3 基于卡尔曼滤波和预测的SRP-RSRC声源定位与跟踪的算法流程  55
    4.4.4 仿真实验对比  55-56
  4.5 本章小结  56-58
第五章系统实现  58-66
  5.1 系统硬件准备  58-60
  5.2 系统的软件实现  60-62
  5.3 室内的麦克风阵列配置情况  62-63
  5.4 实验的结果  63-64
  5.5 二维定位软件  64-65
  5.6 本章小结  65-66
第六章总结和展望  66-69
  6.1 本文的贡献和总结  66-67
  6.2 展望  67-69
参考文献  69-74
致谢  74-75
附录:硕士期间发表论文目录  75-76

室内麦克风阵列声源定位算法研究和实现

内容摘要

全文目录

相似论文