学位论文 > 优秀研究生学位论文题录展示

基于认知模型的运动人手三维跟踪方法研究

作　者: 宋晓娜
导　师: 杨波
学　校: 济南大学
专　业: 计算机应用技术
关键词: 运动人手跟踪认知模型维数灾难手势识别人机交互
分类号: TP391.41
类　型: 硕士论文
年　份: 2010年
下　载: 133次
引　用: 1次
阅　读: 论文下载

内容摘要

通过视觉计算对视频图像序列中的运动人手的姿态进行估计、3D跟踪,是人机交互(Human Comouter Interaction, HCI)研究中的一个基础性和关键性的课题,主要涉及到计算机视觉、人机交互理论、预测估计方法学等众多交叉学科,对其进行深入研究,对于深化智能人机交互理论和应用,推进相关学科的发展具有重要意义。单目视觉条件下基于模型的运动人手三维跟踪的主要目的是:连续获取手势帧图像相对应的三维手势的位置和姿态,为实现自然、和谐的人机交互打下良好的基础。其跟踪方法的本质主要是依据k ? 1时刻的3D手势模型参数和第k时刻的手势帧图像的数据信息,预测k时刻的3D手势,从而达到跟踪的目的。基于模型的跟踪方法特点在于建立3D手势模型特征和手势图像特征之间的映射关系,利用观察到的手势图像特征与3D手势模型进行相似性度量从而确定误差最小的模型参数,本质上是一个在高维空间进行搜索和匹配的问题。然而由于人手是一个复杂的非刚性的多链接物体,且手势本身具有多义性、多样性以及在时间和空间上存在差异性的特点,并且人手具有高自由度,手势的这种高维状态表达是姿态估计中有效全局搜索真实手势的最大障碍,假设运动过程中每个手势自由度只有两个变化趋势,那么对于具有33个自由度的人手来说,每次运算量为2 33,搜索真实手势时容易陷入“维数灾难”的陷阱,使手势跟踪实时性成为一个遥不可及的事情。本文结合计算机科学和认知心理学等相关学科,对3D运动人手跟踪进行多学科的交叉讨论和研究,提出了基于认知模型的运动人手的三维跟踪方法。主要对以下几个关键问题进行了研究:(1)复杂背景下基于空间分布特征的的手势识别。手势识别是先进人机交互研究的一项关键技术。基于自然人手的新型的人机交互理论和应用中,要求用户的手势能处于自然状态,使人能够以自然的方法进行人机交互。本文作者结合手势的全局特征和局部特征对手势进行了更为全面的描述,并且在识别过程中引入“搜索窗口”和“随机采样机制”。“搜索窗口”的引入,实现了准确定位一定尺寸的只包含手势区域的“搜索窗口”,后续的识别过程仅在该“搜索窗口”内进行。一方面缩小了预处理范围,减少了不必要的计算过程,提高了识别速度;另一方面,避免了噪声点和类肤色的干扰,能够做到有大量噪声点和人脸干扰时正确识别手势,提高识别率;结合手势的形状特征引入的随机采样,提高了手势识别速率。本算法不仅能识别总体区分度比较小的手势,且能够识别存在一定弯曲程度的手势,为和谐、自然的人机交互创下了基本条件。(2)提出了基于认知模型的运动人手的三维跟踪方法。自然人机交互过程中,处处都存在着操作者的心理活动,该心理活动直接影响到操作者的运动形式,本文运动人手跟踪方法以认知心理学、行为科学等为理论基础,研究操作者在特定实验条件下的认知心理特征与人手运动的行为特性。首先,运用观察法、实验法、口语报告法等心理学分析方法研究特定人机交互条件下不同操作者的认知心理特点和手势运动特点,并经过训练使不同的操作者实现同一个完整的运动过程,并借助于虚拟辅助平台获取运动数据,然后对数据进行认知曲线拟合,使手势运动特点具体化,数字化,为后续的采样做铺垫。并在此基础上分析数据状态变化趋势,以概率的方式对运动手势数据进行分类,为粒子滤波采样方法提供了一种高效,统一的数学认知模型,以此为基础的采样算法可以避免盲目的搜索,实现高维空间下跟踪手势全自由度的运动姿态时减少对动态模型的依赖,而是更多地信任认知模型提供的运动线索,实验结果表明,与传统滤波算法相比,基于认知模型的手势跟踪算法可以利用更少的运行时间达到更高的跟踪精度。本文的许多研究仍然需要更进一步的探索研究,在自然的人机交互过程中,处处都存在着操作者的心理活动,本文对操作者的心理特征研究只是基于部分简单的运动场景,存在着局部性和肤浅性,普通情况下操作者的普遍心理特征还需要进一步的探索研究。

全文目录

摘要  7-9
Abstract  9-12
第一章绪论  12-20
  1.1 研究背景  12-13
  1.2 研究现状及所存在的问题  13-18
    1.2.1 相机标定  13-14
    1.2.2 手势识别  14-15
    1.2.3 单目视觉下的运动人手跟踪  15-18
  1.3 论文内容安排  18-20
第二章基于粒子群优化算法的摄像机内参数标定方法  20-30
  2.1 引言  20-21
  2.2 经典针孔相机模型  21-23
  2.3 基于粒子群优化的摄像机内参数标定算法  23-25
    2.3.1 样本选择  24
    2.3.2 算法描述  24-25
  2.4 实验结果及分析  25-27
  2.5 本章小结  27-30
第三章复杂背景下的手势识别  30-46
  3.1 引言  30-31
  3.2 手势空间分布特征  31-32
  3.3 复杂背景下基于空间分布特征的静态手势识别  32-37
    3.3.1 复杂背景下基于亮度高斯模型的手势分割算法  32-33
    3.3.2 手势定位  33-35
    3.3.3 手势识别  35-37
  3.4 实验结果分析和比较  37-43
    3.4.1 无肤色干扰的手势识别实验  37-40
    3.4.2 存在肤色干扰的手势识别实验  40-41
    3.4.3 弯曲变形手势的识别  41-43
  3.5 算法分析  43
    3.5.1 算法识别率的分析  43
    3.5.2 算法特点分析  43
  3.6 本章小结  43-46
第四章单目视觉下运动人手三维跟踪  46-64
  4.1 运动人手跟踪系统的实验平台  46-47
  4.2 手势特征点的提取  47-48
  4.3 人手的状态空间描述  48-49
  4.4 基于传统粒子滤波算法的运动人手跟踪  49-62
    4.4.1 传统粒子滤波算法原理  50-54
    4.4.2 基于粒子滤波算法的运动人手跟踪  54-58
    4.4.3 运动人手跟踪实验结果  58-61
    4.4.4 基于粒子滤波算法的运动人手跟踪存在的主要问题  61-62
  4.5 本章小结  62-64
第五章基于认知模型的运动人手三维跟踪  64-92
  5.1 基于数字手套的3D 虚拟辅助平台开发  64-71
    5.1.1 3D 虚拟辅助平台开发  64-67
    5.1.2 3D 虚拟辅助平台数据分析  67-71
  5.2 基于多表达式编程算法的数据拟合  71-78
    5.2.1 多表达式编程算法简介  71-73
    5.2.2 数据拟合结果  73-77
    5.2.3 数据状态变化分类  77-78
  5.3 认知模型简介  78-83
    5.3.1 GOMS 模型简介  79-80
    5.3.2 本文提出的 GAMA 模型  80-83
  5.4 基于认知模型的运动人手跟踪及其实验结果  83-91
    5.4.1 实验环境  85
    5.4.2 实验评价标准  85-86
    5.4.3 实验结果  86-91
  5.5 本章小结  91-92
第六章结论与展望  92-94
  6.1 全文总结  92-93
  6.2 下一步研究工作  93-94
参考文献  94-102
致谢  102-104
附录A (攻读学位期间发表论文目录)  104-106
附录B (攻读学位期间参加的科研项目)  106

基于认知模型的运动人手三维跟踪方法研究

内容摘要

全文目录

相似论文