学位论文 > 优秀研究生学位论文题录展示

基于声音特征的动物行为识别系统研究

作 者: 于天福
导 师: 苏健民
学 校: 东北林业大学
专 业: 计算机应用技术
关键词: 行为识别 BREWMP 特征提取 高斯统计模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 96次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着经济发展,对环境的污染日趋严重、人类对自然资源掠夺式的开发、对野生动物的非法捕猎,严重破坏了动物的栖息地和种群结构,使野生动物的保护问题变得更加紧迫。然而实际情况是野生动物一般生存在人迹罕见的野外,人类通常是只闻其声不见其形,为研究和保护它们带来了困难。因此,基于动物叫声来研究它们的生存状态有着实际的意义,同时对生物其他特征的研究和环境监测也有一定的指导作用。人类通过语言彼此进行沟通传递信息,而动物多数情况下也是通过叫声与种群内的其它成员进行交流,因而基于动物叫声的行为识别是有一定事实基础的。本文选题的目的在于将数字信号处理理论,模式识别理论,以及相关的前沿计算机技术应用于动物保护工作,研究出一套能够自动监测反馈动物生存状态的智能仿真系统。通过对现有声音识别技术进行研究,在掌握识别原理及其系统的结构以后,提取动物特定行为时的叫声特征进行建模,并将其作为该行为的标准模型,最后在进行识别的时候根据判决策略做出动物相应的判断。高斯混合统计模型(GMM)具有其它模型无可比拟的诸多优点,能够更健壮地描述声音信号,捕获其中重要的声学特征。因此,本文主要依托BREWMP平台利用高斯统计模型对基于动物叫声的行为识别做了基础性研究。主要内容如下:(1)研究了在BREWMP平台对声音信号处理的基本方法,提出了一套针对高通公司特有的音频格式文件(QCP格式)的解码算法,并探讨了将此算法解码出的数据作为模型的输入进行模型训练的方法;(2)研究了动物特定行为叫声的规律,通过对叫声信号时域和频域的特征的提取,并对提取的特征参数做出评价,找出能够更具灵活性和鲁棒性的表征动物特定行为的叫声特征参数;(3)具体以狗攻击、警告、讨好时吠叫声为研究对象,以它们的功率谱、MFCC、基音频率为特征参量,为每种行为建立GMM模型,在计算模型特征似然度的时候对时域特征和频域特征分别加权,并且提高时域特征的权重,然后对待测叫声信号进行似然度计算,经过决策达到识别动物行为意义的目的。在此基础之上,本文在BREWMP仿真环境下,建立了基于动物叫声的行为识别系统的实验平台。通过测试表明,本系统可以较好地实现通过动物叫声进行行为识别的功能,获得了令人满意的识别效果。本文以狗为研究对象,通过对其叫声特征的研究达到识别攻击、警告、讨好三种行为的目的,为进一步分析狗的其他行为伴随叫声特征以及野生动物的行为生物学特征提供了理论与方法基础。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-14
  1.1 课题背景  9
  1.2 基于动物叫声的行为识别的意义及理论依据  9-10
    1.2.1 研究意义  9-10
    1.2.2 理论基础  10
  1.3 BREWMP和声音识别技术的发展  10-12
    1.3.1 BREW技术发展概况  10-11
    1.3.2 声音识别技术发展概况  11-12
  1.4 基于动物叫声的行为识别方法和原理  12-13
    1.4.1 基本方法  12-13
    1.4.2 研究的原理  13
    1.4.3 技术难点  13
  1.5 本文的主要工作  13-14
2 BREWMP下的声音处理  14-24
  2.1 BREWMP的架构  14-15
  2.2 BREWMP重要的基本概念  15-16
  2.3 BREWMP声音信号的采集  16-18
    2.3.1 BREWMP支持的声音格式  16
    2.3.2 BREWMP下声音的采集  16-18
  2.4 BREWMP环境下的动物叫声识别Applet设计  18-23
    2.4.1 BREWMP的模拟开发环境  18-19
    2.4.2 BREWMP的Extension设计  19-21
    2.4.3 动物叫声信号处理Applet  21-23
  2.5 本章小结  23-24
3 动物声音信号的预处理  24-33
  3.1 声音信号的表示  24-25
    3.1.1 声音信号的数字化  24
    3.1.2 声音信号的的参数表示  24-25
  3.2 声音信号的时域特征  25-27
    3.2.1 短时自相关函数  25-26
    3.2.2 动物叫声信号的基音检测  26-27
  3.3 声音信号的频域特征  27-30
    3.3.1 动物叫声的功率谱  27-28
    3.3.2 Mel频率  28
    3.3.3 MFCC的求解  28-30
  3.4 特征提取的具体问题  30-31
  3.5 矢量量化  31-32
    3.5.1 矢量量化的原理  31-32
    3.5.2 失真测度  32
  3.6 本章小结  32-33
4 GMM在动物叫声识别中的应用  33-42
  4.1 声音识别模型概述  33-34
  4.2 统计模型-GMM  34-38
    4.2.1 高斯混合模型GMM  34-36
    4.2.2 GMM参数训练  36-38
    4.2.3 GMM模型的概率输出  38
  4.3 基于叫声特征似然度加权的特定行为识别算法  38-41
    4.3.1 对角协方差假设  39
    4.3.2 特征似然度加权  39-41
    4.3.3 决策策略  41
  4.4 本章小结  41-42
5 系统实现与实验分析  42-51
  5.1 GMM移植到BREWMP  42-47
    5.1.1 系统UI设计  42-44
    5.1.2 QCP格式数据解码  44-45
    5.1.3 BREWMP OEM层设计  45-47
  5.2 实验与结论  47-50
    5.2.1 实验语料库描述  47-48
    5.2.2 不同特征的对识别性能的影响  48-49
    5.2.3 特征似然度加权对系统性能的影响  49-50
  5.3 本章小结  50-51
结论  51-53
参考文献  53-55
附录A  55-56
附录B  56-57
攻读学位期间发表的学术论文  57-58
致谢  58-59

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  7. 空间交会接近视觉测量方法研究,TP391.41
  8. 图像实时采集、存储与处理方法研究,TP391.41
  9. 唇读中的特征提取、选择与融合,TP391.41
  10. 多币种纸币处理技术的研究与实现,TP391.41
  11. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 移动机器人视觉检测和跟踪研究,TP242.62
  14. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  15. 基于随机森林的植物抗性基因识别方法研究,Q943
  16. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  17. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  18. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  19. 红外图像目标识别及跟踪技术研究,TP391.41
  20. 水下目标特征的压缩与融合技术研究,TN911.7
  21. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com