学位论文 > 优秀研究生学位论文题录展示

单目视频中人体运动建模及姿态估计研究

作 者: 欧阳毅
导 师: 张三元
学 校: 浙江大学
专 业: 计算机科学与技术
关键词: 姿态估计 SIFT特征 人体检测 面向梯度的直方图 条件随机场
分类号: TP391.41
类 型: 博士论文
年 份: 2012年
下 载: 459次
引 用: 1次
阅 读: 论文下载
 

内容摘要


对于单目视频中人体运动的自动理解和姿态估计一直是计算机视觉研究的热点问题。本文从五个方面对基于单目视频的人体检测及运动分析展开研究,分析了基于视频的人体检测技术:三维人体运动捕获技术,行人检测技术,视频人体运动特征提取的方法,人体运动跟踪技术和人体运动姿态估计技术。在此基础上进行人体运动建模和基于单目图像的姿态估计。首先采用基于窗口梯度势能的遮挡人体检测方法对视频中人体信息进行检测,提出了一种基于窗口梯度势能(Window Gradient Potential Energy,WGPE)的人体检测方法。在特征窗口扫描过程中,通过加权级联SVM,实现对半遮挡情况下的人体检测,利用稀疏-稠密窗口势能集筛选缩短了检测时间。由于WGPE利用了HOG特征计算过程中的梯度信息,因此本算法与其他的基于HOG的快速检测算法来,并不需要增加过多的计算开销,在背景较为平滑的图像中,与传统的HOG检测方法相比具有较少的检测时间,对于较复杂的背景,本算法与传统的HOG检测算法相当。实验表明在人体检测的准确率和效率方面有所提高,对于处于半遮挡情况下人体检测,准确率也有明显提高。对图像中人体姿态估计方面,采用基于贝叶斯模型的人体运动姿态估计方法,对静态图像中人体进行肢体进行分析。提出基于边缘轮廓特征的贝叶斯模型,为了进一步提高肢体分析的准确率引入了基于骨架轨迹图对姿态进行分析。对于视频图像中人体的姿态分析采用基于条件随机场模型的静态图像姿态估计,首先对图像中人体运动姿态的SIFT特征进行提取,建立SIFT人体运动特征库对人体运动姿态进行估计,采用基于条件随机场的肢体可变结构对人体进行建模,并采用条件随机场模型对对人体姿态进行估计,为进一步提高姿态估计的准确率和满足实时性的要求,先对人体运动数据进行运动节奏特征数据的提取,提出基于EM-GM人体运动节奏特征数据的自动提取算法;对视频图像中的人体运动采用动态构建颜色-边缘特征人体模型的方法进行建模,其中各肢体的边缘信息匹配采用快速定向导角(Fast Directional Chamfer Matching FDCM)方法,并提出了快速人体肢体检测算法。然后采用基于节奏运动信息进行人体三维姿态估计。对检测结果融入运动节奏信息进行三维人体姿态估计,在参数的推理过程中,首先采用GPLVM方法对人体运动数据进行降维处理,再采用局部动态特征建模,最后进行三维人体姿态参数估计。对于视频图像中人体姿态估计,本文提出了基于约束图的视频人体姿态估计方法,首先建立层次组合的人体运动模型,定义了人体肢体模型。并提出了基于相关动作簇的运动模型,为了缩减搜索空间,提出RPC节点图生成树算法,并细化了RPC的节点合并,节点分裂和生成树平衡算法。根据RPC节点图生成树算法,提出了视频人体姿态估计算法,和基于RPC生成树模型的推理算法。提出了一种基于三维人体动作库投影图数据驱动的(Markov chain Monte Carlo MCMC)方法对单目视频图像中的人体姿态进行跟踪,首先对运动捕捉设备获取的人体基本运动库中人体外观在不同视角下的外观投影图进行聚类;采用HOG对单目视频图像中人体进行检测,能较准确分割出人体各肢体位置;最后通过三维人体姿态推理算法外观模型对每帧进行分析模型,再利用时间约束的分析模型对目标进行跟踪。采用约束图驱动的MCMC和基本动作库相结合构建一个适用于视频数据建模的,并将该模型应用于数据驱动的联机行为识别,提高人体姿态的建模能力

全文目录


致谢  5-7
摘要  7-9
Abstract  9-11
目次  11-15
擂图和附表清单  15-18
1 绪论  18-25
  1.1 研究背景  18-21
  1.2 研究问题  21-22
  1.3 采用方法  22-23
  1.4 本文贡献  23
  1.5 论文组织  23-25
2 基于视频的人体检测及运动分析技术综述  25-40
  2.1 三维人体运动捕获技术  25-29
  2.2 行人检测技术  29-30
  2.3 视频人体运动特征提取  30-33
    2.3.1 形状轮廓的特征  30-31
    2.3.2 边缘梯度特征  31-32
    2.3.3 局部时空特征  32-33
  2.4 人体运动跟踪技术  33-36
    2.4.1 背景减除  33-34
    2.4.2 均值漂移  34-35
    2.4.3 粒子滤波  35-36
  2.5 人体运动姿态估计技术  36-39
    2.5.1 基于多幅图像的姿态估计  37
    2.5.2 基于单目图像的姿态估计  37-38
    2.5.3 基于HMM的姿态推理  38-39
  2.6 本章小结  39-40
3 基于窗口梯度势能的遮挡人体检测方法  40-55
  3.1 窗口边缘梯度势能  41-44
  3.2 稀疏-稠密窗口势能集  44-46
  3.3 加权级联结构SVM  46-47
  3.4 遮挡环境下人体快速检测算法  47-48
  3.5 实例及分析  48-54
    3.5.1 检测准确率评价  49-51
    3.5.2 检测效率  51-54
  3.6 本章小结  54-55
4 基于贝叶斯模型的静态图像姿态估计研究  55-67
  4.1 基于边缘轮廓特征的贝叶斯模型  58-59
  4.2 基于骨架运动轨迹图的姿态估计  59-61
  4.3 参数估计  61-63
    4.3.1 最大或然率估计  61-62
    4.3.2 基于骨架运动轨迹图的贝叶斯模型  62-63
  4.4 实验及分析  63-66
  4.5 本章小结  66-67
5 基于CRF模型的视频图像人体姿态估计研究  67-82
  5.1 人体运动SIFT特征提取预处理  68-73
    5.1.1 网络概率图模型  69-71
    5.1.2 SIFT特征提取算法  71-72
    5.1.3 实验结果及分析  72-73
  5.2 基于条件随机场的肢体可变结构  73-77
  5.3 基于CRF的人体三维姿态估计  77-80
  5.4 实验及分析  80-81
  5.5 本章小结  81-82
6 基于运动节奏数据的单目视频人体运动估计  82-101
  6.1 人体运动数据分析  83-87
    6.1.1 自适应节奏数据的特征提取算法  83-84
    6.1.2 基于EM-GM人体运动节奏特征数据提取算法  84-87
  6.2 动态构建颜色-边缘人体模型  87-90
    6.2.1 基于HOG边缘特征的人体检测  88-89
    6.2.2 基于肢体掩码模板库的颜色直方图肢体检测  89-90
    6.2.3 肢体的边缘特征检测  90
  6.3 基于边缘及颜色直方图的运动特征检测算法  90-94
    6.3.1 Chamfer distance  91-92
    6.3.2 快速定向导角Chamfer匹配  92
    6.3.3 快速人体肢体检测算法  92-94
  6.4 基于运动节奏信息的人体三维姿态估计  94-97
    6.4.1 人体运动特征降维处理  94-96
    6.4.2 局部动态特性建模  96
    6.4.3 模型参数的估计  96-97
  6.5 实验及分析  97-100
  6.6 本章小结  100-101
7 基于约束图的视频人体姿态估计  101-114
  7.1 层次组合的人体运动模型  101-104
    7.1.1 人体肢体模型  102-103
    7.1.2 基于相关动作簇的运动模型  103-104
  7.2 RPC节点图生成树算法  104-107
    7.2.1 节点合并  105
    7.2.2 节点分裂  105-106
    7.2.3 生成树平衡算法  106-107
  7.3 视频人体姿态估计算法  107-110
    7.3.1 基于RPC生成树模型的推理  107
    7.3.2 先验分布  107-108
    7.3.3 三维人体姿态推理  108-109
    7.3.4 提议函数  109-110
  7.4 实例及分析  110-113
  7.5 本章小结  113-114
8 总结与展望  114-118
  8.1 总结  114-115
  8.2 展望  115-118
参考文献  118-132
个人简历及攻读博士学位期间的成果  132-133

相似论文

  1. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  2. 基于空间邻域词袋模型的图像标注技术,TP391.41
  3. 基于树型条件随场的特定域事件提取方法研究,TP391.1
  4. 基于相似性测量检测图像型垃圾邮件技术的研究,TP393.098
  5. 融合深度图和三维模型的人体运动捕捉技术研究,TP391.41
  6. 基于条件随机场的RNA二级结构预测算法,R346
  7. 基于多幅图像的几何和纹理自动重建,TP391.41
  8. 利用Kinect估计人体头部姿态,TP391.41
  9. 基于SIFT特征和SVM的场景分类,TP391.41
  10. 基于字词联合解码的中文分词研究,TP391.1
  11. 特定领域中文术语抽取,TP391.1
  12. 基于分割一致性的二维人体姿态估计,TP391.41
  13. 图像制导模拟器图像生成研究,TP391.41
  14. 动态场景下运动目标检测与跟踪,TP391.41
  15. 抗几何攻击图像水印算法研究,TP309.7
  16. 中文命名实体识别与歧义消解研究,TP391.1
  17. 基于模型的人体运动跟踪和姿态分析技术研究,TP391.41
  18. 中文命名实体识别及若干相关问题的研究,TP391.41
  19. 基于单摄像头的360度旋转跟踪系统,TP391.41
  20. 复杂场景下的视觉目标跟踪方法研究,TP391.41
  21. GPU通用计算与基于SIFT特征的图像匹配并行算法研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com