学位论文 > 优秀研究生学位论文题录展示

基于声音特征的动物行为识别系统研究

作　者: 于天福
导　师: 苏健民
学　校: 东北林业大学
专　业: 计算机应用技术
关键词: 行为识别 BREWMP 特征提取高斯统计模型
分类号: TN912.34
类　型: 硕士论文
年　份: 2010年
下　载: 96次
引　用: 0次
阅　读: 论文下载

内容摘要

随着经济发展,对环境的污染日趋严重、人类对自然资源掠夺式的开发、对野生动物的非法捕猎,严重破坏了动物的栖息地和种群结构,使野生动物的保护问题变得更加紧迫。然而实际情况是野生动物一般生存在人迹罕见的野外,人类通常是只闻其声不见其形,为研究和保护它们带来了困难。因此,基于动物叫声来研究它们的生存状态有着实际的意义,同时对生物其他特征的研究和环境监测也有一定的指导作用。人类通过语言彼此进行沟通传递信息,而动物多数情况下也是通过叫声与种群内的其它成员进行交流,因而基于动物叫声的行为识别是有一定事实基础的。本文选题的目的在于将数字信号处理理论,模式识别理论,以及相关的前沿计算机技术应用于动物保护工作,研究出一套能够自动监测反馈动物生存状态的智能仿真系统。通过对现有声音识别技术进行研究,在掌握识别原理及其系统的结构以后,提取动物特定行为时的叫声特征进行建模,并将其作为该行为的标准模型,最后在进行识别的时候根据判决策略做出动物相应的判断。高斯混合统计模型(GMM)具有其它模型无可比拟的诸多优点,能够更健壮地描述声音信号,捕获其中重要的声学特征。因此,本文主要依托BREWMP平台利用高斯统计模型对基于动物叫声的行为识别做了基础性研究。主要内容如下：(1)研究了在BREWMP平台对声音信号处理的基本方法,提出了一套针对高通公司特有的音频格式文件(QCP格式)的解码算法,并探讨了将此算法解码出的数据作为模型的输入进行模型训练的方法；(2)研究了动物特定行为叫声的规律,通过对叫声信号时域和频域的特征的提取,并对提取的特征参数做出评价,找出能够更具灵活性和鲁棒性的表征动物特定行为的叫声特征参数；(3)具体以狗攻击、警告、讨好时吠叫声为研究对象,以它们的功率谱、MFCC、基音频率为特征参量,为每种行为建立GMM模型,在计算模型特征似然度的时候对时域特征和频域特征分别加权,并且提高时域特征的权重,然后对待测叫声信号进行似然度计算,经过决策达到识别动物行为意义的目的。在此基础之上,本文在BREWMP仿真环境下,建立了基于动物叫声的行为识别系统的实验平台。通过测试表明,本系统可以较好地实现通过动物叫声进行行为识别的功能,获得了令人满意的识别效果。本文以狗为研究对象,通过对其叫声特征的研究达到识别攻击、警告、讨好三种行为的目的,为进一步分析狗的其他行为伴随叫声特征以及野生动物的行为生物学特征提供了理论与方法基础。

全文目录

摘要  4-5
Abstract  5-9
1 绪论  9-14
  1.1 课题背景  9
  1.2 基于动物叫声的行为识别的意义及理论依据  9-10
    1.2.1 研究意义  9-10
    1.2.2 理论基础  10
  1.3 BREWMP和声音识别技术的发展  10-12
    1.3.1 BREW技术发展概况  10-11
    1.3.2 声音识别技术发展概况  11-12
  1.4 基于动物叫声的行为识别方法和原理  12-13
    1.4.1 基本方法  12-13
    1.4.2 研究的原理  13
    1.4.3 技术难点  13
  1.5 本文的主要工作  13-14
2 BREWMP下的声音处理  14-24
  2.1 BREWMP的架构  14-15
  2.2 BREWMP重要的基本概念  15-16
  2.3 BREWMP声音信号的采集  16-18
    2.3.1 BREWMP支持的声音格式  16
    2.3.2 BREWMP下声音的采集  16-18
  2.4 BREWMP环境下的动物叫声识别Applet设计  18-23
    2.4.1 BREWMP的模拟开发环境  18-19
    2.4.2 BREWMP的Extension设计  19-21
    2.4.3 动物叫声信号处理Applet  21-23
  2.5 本章小结  23-24
3 动物声音信号的预处理  24-33
  3.1 声音信号的表示  24-25
    3.1.1 声音信号的数字化  24
    3.1.2 声音信号的的参数表示  24-25
  3.2 声音信号的时域特征  25-27
    3.2.1 短时自相关函数  25-26
    3.2.2 动物叫声信号的基音检测  26-27
  3.3 声音信号的频域特征  27-30
    3.3.1 动物叫声的功率谱  27-28
    3.3.2 Mel频率  28
    3.3.3 MFCC的求解  28-30
  3.4 特征提取的具体问题  30-31
  3.5 矢量量化  31-32
    3.5.1 矢量量化的原理  31-32
    3.5.2 失真测度  32
  3.6 本章小结  32-33
4 GMM在动物叫声识别中的应用  33-42
  4.1 声音识别模型概述  33-34
  4.2 统计模型-GMM  34-38
    4.2.1 高斯混合模型GMM  34-36
    4.2.2 GMM参数训练  36-38
    4.2.3 GMM模型的概率输出  38
  4.3 基于叫声特征似然度加权的特定行为识别算法  38-41
    4.3.1 对角协方差假设  39
    4.3.2 特征似然度加权  39-41
    4.3.3 决策策略  41
  4.4 本章小结  41-42
5 系统实现与实验分析  42-51
  5.1 GMM移植到BREWMP  42-47
    5.1.1 系统UI设计  42-44
    5.1.2 QCP格式数据解码  44-45
    5.1.3 BREWMP OEM层设计  45-47
  5.2 实验与结论  47-50
    5.2.1 实验语料库描述  47-48
    5.2.2 不同特征的对识别性能的影响  48-49
    5.2.3 特征似然度加权对系统性能的影响  49-50
  5.3 本章小结  50-51
结论  51-53
参考文献  53-55
附录A  55-56
附录B  56-57
攻读学位期间发表的学术论文  57-58
致谢  58-59

基于声音特征的动物行为识别系统研究

内容摘要

全文目录

相似论文