学位论文 > 优秀研究生学位论文题录展示

基于分层方法的复杂人体行为识别研究

作　者: 谢立东
导　师: 潘伟
学　校: 厦门大学
专　业: 计算机技术
关键词: 人体行为识别深度学习隐马尔科夫模型上下文无关文法 Kinect
分类号: TP391.41
类　型: 硕士论文
年　份: 2014年
下　载: 13次
引　用: 0次
阅　读: 论文下载

内容摘要

人体行为识别的目标是使计算机能够从包含人动作的视频图像中识别、理解出人的行为,这需要计算机具备一定的计算机视觉、机器学习能力。目前,由于受到技术限制和相关理论限制,人体行为识别还停留在初级阶段,识别任务较为简单。这样,计算机就不能较好地通过摄像头理解人的动作行为,这限制了人机交互、智能家居、视频内容检索等领域的发展。本文提出了一种基于分层方法的人体行为识别架构,该架构分为三层：第一层为原子动作识别,采用深度学习范式——栈式降噪自编码神经网络进行建模学习。在第一层图像预处理阶段提取人体轮廓,标定其为感兴趣区域并进行缩放操作,降低数据维度。提出了金字塔型架构的网络层节点数选择方案,节省计算开支。同时基于训练均方误差提出神经网络学习率更新策略,提升识别精度。第二层为序列动作识别,它通过利用第一层的深度网络模型,将视频序列转换为观测符号序列。接着采用多序列HMM模型进行建模,改善了序列间的相关性。第三层为复杂、交互行为识别,采用上下文无关文法进行描述识别。依据第二层学习到的HMM模型,对新的视频序列进行分割提取子事件起止时间点。分割算法引入连续相同动作判定规则,提出了HMM估值定界算法,简化了分割过程。在上下文无关文法描述中,添加描述子信息,满足复杂的逻辑关系。最后实验分析了整个系统,具备一定的可用性和扩展性。本文利用Kinect设备采集数据,提供了良好的深度、骨骼图像,提升工作效率。与传统的人体行为识别相比,我们采用最新的深度学习技术提升原子层动作的识别,为后续工作奠定基础。采用上下文无关文法进行描述行为,能够描述识别更为复杂的动作,具备良好的扩展性。整个识别方法隶属于分层方法,各层可由相似算法、规则自由替换,灵活性较强。在保证底层识别精度的前提下,高层可以仅采用少量数据而获得较高的识别精度。

全文目录

摘要  4-5
Abstract  5-10
Table of Contents  10-13
第一章绪论  13-23
  1.1 研究背景及意义  13-15
  1.2 人体行为识别研究进展  15-18
    1.2.1 单层行为识别方法  15-17
    1.2.2 分层行为识别方法  17-18
  1.3 系统概述  18-20
  1.4 本文主要工作  20-21
  1.5 本文结构安排  21-23
第二章基于深度学习的原子动作识别方法  23-45
  2.1 深度学习相关理论  23-29
    2.1.1 深度置信网  24-26
    2.1.2 栈式自编码神经网络  26-27
    2.1.3 卷积神经网络  27-28
    2.1.4 稀疏编码  28-29
  2.2 深度学习面临的问题  29-30
    2.2.1 理论问题  29
    2.2.2 建模问题  29
    2.2.3 工程问题  29-30
  2.3 深度学习应用于人体行为识别  30-35
    2.3.1 深度学习与人体行为识别的关系  30-31
    2.3.2 识别系统概述  31
    2.3.3 图像预处理  31-33
    2.3.4 栈式降噪自编码神经网络  33-35
  2.4 深度网络参数优化策略  35-39
    2.4.1 深度网络预训练的优势  35-36
    2.4.2 噪声率优化  36-37
    2.4.3 学习率优化  37-38
    2.4.4 金字塔型架构的节点选择  38-39
  2.5 原子动作实验分析  39-43
    2.5.1 Kinect简介  40
    2.5.2 深度数据定义与获取  40-41
    2.5.3 Kinect行为数据集  41
    2.5.4 评估apSDAE架构的性能  41-42
    2.5.5 经典算法的比较  42
    2.5.6 Weizmann数据集验证  42-43
  2.6 本章小结  43-45
第三章基于隐马尔科夫模型的序列动作识别方法  45-59
  3.1 马尔科夫过程  45-46
  3.2 隐马尔科夫模型  46-51
    3.2.1 隐马尔科夫模型的三大问题  47-51
  3.3 HMM应用于人体行为识别  51-54
    3.3.1 人体行为识别同HMM的关系  51-52
    3.3.2 多序列隐马尔科夫模型的训练  52-54
  3.4 序列动作实验分析  54-57
    3.4.1 原子动作识别  55
    3.4.2 序列动作识别  55-57
  3.5 本章小结  57-59
第四章基于上下文无关文法描述的复杂行为识别方法  59-77
  4.1 上下文无关文法与人体行为识别  59-60
  4.2 描述逻辑关系定义  60-62
    4.2.1 时间描述子  61
    4.2.2 空间描述子  61-62
    4.2.3 逻辑描述子  62
  4.3 行为的表示  62-66
    4.3.1 原子动作表示  62-63
    4.3.2 复杂动作表示  63-65
    4.3.3 交互动作表示  65-66
  4.4 人体复杂行为实验分析  66-76
    4.4.1 人脸朝向识别  66-68
    4.4.2 序列动作时间起止点确定  68-70
    4.4.3 单人复杂动作的识别  70-72
    4.4.4 多人交互动作的识别  72-74
    4.4.5 实验结果  74-76
  4.5 本章小结  76-77
第五章工作总结及展望  77-79
  5.1 工作总结  77
  5.2 展望  77-79
参考文献  79-85
附录攻读硕士期间发表的论文  85-87
致谢  87

相似论文

网络语音传输丢包的恢复技术,TN912.3
领域实体属性及事件抽取技术研究,TP391.1
面向统计机器翻译的解码算法的研究,TP391.2
网络环境下开展学习叙事促进学生深度学习研究,G434
基于视觉的运动人体行为分析,TP391.41
语音识别在访问控制的应用,TN912.34
基于隐马尔科夫模型的操作员功能状态分类,TP273
基于马尔可夫链蒙特卡罗方法的RBM学习算法改进,O211.62
复杂场景中的时空特征学习与人体行为分析,TP391.41
基于条件随机场的RNA二级结构预测算法,R346
利用Kinect估计人体头部姿态,TP391.41
应用Kinect与手势识别的增强现实教育辅助系统,TP391.41
智能视频监控系统中人体异常行为检测与识别研究,TP391.41
隐马尔可夫模型下基于通信流的隐组识别,TP301.6
促进深度学习的教学策略研究,G424.21
基于潜在语义分析的单文本自动摘要方法研究,TP391.1
基于立体视觉的手形手势识别研究,TP391.41
基于HMM/SVM混合模型的核电设备故障诊断技术研究及数据库系统开发,TM623.4
基于手持技术的学生化学实验认知能力培养研究,G633.8
网络环境下大学生深度学习的研究,G434
结构化支持向量机学习方法及应用研究,TP18