手势识别技术是新一代人机交互的重要内容,使用计算机通过摄像头理解人们的手势并做出相应的反应,使人们摆脱了传统的键盘鼠标,将改变人们的生产生活方式。本文概论了基于视觉的手势识别的基本理论和研究状况,构建了一个基于手部约束的模型" />
学位论文 > 优秀研究生学位论文题录展示

基于计算机视觉的手势识别系统研究

作 者: 周航
导 师: 阮秋琦
学 校: 北京交通大学
专 业: 信号与信息处理
关键词: 手势识别 跟踪 SBB HCI  定位 点脊模型 SVM
分类号: TP391.41
类 型: 博士论文
年 份: 2008年
下 载: 1704次
引 用: 14次
阅 读: 论文下载
 

内容摘要


基于视觉的势识别 的学位论文">手势识别技术是新一代人机交互的重要内容,使用计算机通过摄像头理解人们的手势并做出相应的反应,使人们摆脱了传统的键盘鼠标,将改变人们的生产生活方式。本文概论了基于视觉的手势识别的基本理论和研究状况,构建了一个基于手部约束的模型,然后对手进行分割。提出SVM的改进分类算法后,讨论了手部的运动跟踪和估计,最后介绍了一个实时的手势识别系统。通过研究证明基于视觉的手势识别具有很高的研究价值和发展前景。论文的创新点如下:●提出了基于骨骼约束关系的模糊点脊模型,通过点脊模型,忽略弯曲的部分因素,实现对手部区域的定位。算法优势在于能够剔除非关键信息,减少了图像特征的数目,节省了运行时间。●提出了用于分割期间手势分类的SBB算法,对比Adaboost等算法,适合数目较多的字母手势的分类。保持了原有Boosting算法良好的泛化特性,能够克服一定的遮挡和弯曲。●提出了一种肤色关联光流估计算法。较好解决了跟踪过程中动态手势遮挡的问题,能克服一定的运动模糊带来的困难,对于光照不敏感。●提出了一个基于肤色的相干映射手势跟踪算法。利用一般关联映射建立起点周围的矩形区域和环绕区域的映射,通过空间变换弱化了手势图像的模糊现象对识别的干扰,保证了映射过程中特征点的抗畸变性能。●提出了一个一对多的多层次SVM学习的判决规则。使用一对多分类器,避免了一对一分类器巨大的计算量。多层次的SVM,保证了分类过程中的较低开销。

全文目录


致谢  5-6
中文摘要  6-7
ABSTRACT  7-12
1 综述  12-30
  1.1 引言  12
  1.2 目前人机交互系统存在的不足  12-13
  1.3 基于视觉的势识别 的学位论文">手势识别系统的基本框架  13-15
  1.4 VBGR技术的主要应用领域  15-16
  1.5 VBGR的分类  16-20
    1.5.1 按研究方式的宏微观的划分  16-19
      1.5.1.1 基于轮廓的方法  16-17
      1.5.1.2 基于模型的方法  17-19
    1.5.2 按学习方法的划分  19
    1.5.3 按采集方式的划分  19-20
    1.5.4 按时空关系的划分  20
    1.5.5 按目的划分  20
    1.5.6 其他划分  20
  1.6 VBGR的基本要求及性能指标  20-21
  1.7 VBGR目前遇到的难题  21-22
  1.8 VBGR涉及到的技术  22-23
  1.9 确定VBGR进行研究的思路  23-25
    1.9.1 与其它识别方法的比较  23-24
    1.9.2 本文研究的对象  24
    1.9.3 本文的选题意义  24-25
  1.10 VBGR的国内外研究动态  25-27
    1.10.1 国际的研究情况  25-27
    1.10.2 国内的研究情况  27
  1.11 本文的内容安排  27-29
  1.12 小结  29-30
2 基于视觉的手势识别相关技术基础  30-50
  2.1 相关的分割算法  30-37
    2.1.1 阈值分割算法  30-31
    2.1.2 主动轮廓模型算法  31-33
    2.1.3 基于边界的分割算法  33-34
    2.1.4 区域增长分割算法  34-37
      2.1.4.1 肤色区域生长算法  34-35
      2.1.4.2 ROI区域生长算法  35-37
  2.2 用于分类的相关算法介绍  37-40
    2.2.1 主元分析法和其衍生算法  37-38
    2.2.2 线性指尖模型  38-39
    2.2.3 运动因果因素分析  39-40
  2.3 学习算法  40-46
    2.3.1 单一学习算法  40-45
      2.3.1.1 基于实例的方法  40-42
      2.3.1.2 基于隐马尔科夫模型(HMM)  42-43
      2.3.1.3 基于神经网络  43-44
      2.3.1.4 支撑向量机  44-45
    2.3.2 复合学习算法  45-46
  2.4 相关的颜色空间分析  46-49
    2.4.1 对肤色分布区域的特定色彩变换  46-47
    2.4.2 由RGB空间到CIELab空间的转换  47-48
    2.4.3 HSV空间坐标转换  48-49
  2.5 小结  49-50
3 基于约束的手部关节模型的研究  50-71
  3.1 手势模型的分类及特点  50-52
    3.1.1 基于三维的手势模型  51
    3.1.2 基于表观的手势模型  51-52
  3.2 手部骨骼模型的构建  52-54
    3.2.1 手的骨骼结构  52-53
    3.2.2 关节运动分析  53-54
  3.3 基于约束的手部模型设计  54-67
    3.3.1 建模的依据  55-56
    3.3.2 手部的一般运动约束  56-59
    3.3.3 手指模型的特殊约束  59-60
    3.3.4 模糊点脊模型(BR Model)  60-67
      3.3.4.1 图像特征分析  61-62
      3.3.4.2 尺度空间  62-63
      3.3.4.3 特征间关系  63
      3.3.4.4 手特征和点脊模型  63-65
      3.3.4.5 点脊模型的手部尺度估计  65-67
  3.4 试验结果和讨论  67-69
    3.4.1 改进的DOF骨骼手部特征定位结果  67
    3.4.2 点脊模型的手部特征定位结果  67-68
    3.4.3 基于DOF约束的人手模型矩形体仿真(无输入)  68
    3.4.4 基于约束的人手模型椭圆体仿真(有输入)  68-69
    3.4.5 实验对比和讨论  69
  3.5 小结  69-71
4 手部区域分割与特征提取算法研究  71-91
  4.1 基于视觉的手势分割和特征提取研究简介  71-72
  4.2 手势分割分类和特点  72
  4.3 结合肤色的手势分割算法  72-79
    4.3.1 手势分割的预处理技术  72-74
      4.3.1.1 改进的差分分割算法  72-73
      4.3.1.2 手指定位的几何学分析  73-74
      4.3.1.3 手势图像的配准  74
    4.3.2 肤色空间的处理  74-77
      4.3.2.1 CIELab空间的手势平均转移分割  74-75
      4.3.2.2 HSV空间的手势分析  75-77
    4.3.3 基于HSV色度的直方图匹配算法  77-79
    4.3.4 提取手部区域  79
  4.4 特征提取的SBB算法  79-86
    4.4.1 Boosting算法简述  79-80
    4.4.2 NNMF算法  80-81
    4.4.3 SBB弱假设基本原理  81-83
    4.4.4 分类算法分析  83-86
    4.4.5 算法基本步骤  86
  4.5 实验结果  86-89
    4.5.1 基于肤色的差分分割提取实验  86-88
    4.5.2 对指尖的定位搜索实验  88
    4.5.3 HSV色度的直方图匹配实验  88
    4.5.4 基于SBB算法的手势识别结果  88-89
  4.6 小结  89-91
5 基于多分类器的多层次支持向量机手势识别算法研究  91-107
  5.1 引言  91-92
  5.2 最佳分配平面(OSH)的获取  92-102
    5.2.1 优化问题的提出  92-93
    5.2.2 分类器和和函数设定  93-95
    5.2.3 支撑向量的更新  95-96
    5.2.4 多分类识别--一对多策略  96
    5.2.5 SVM优化判决器  96-101
    5.2.6 误检测的惩罚  101-102
  5.3 实验结果和讨论  102-104
  5.4 小结和讨论  104-107
6 基于视觉的手部运动跟踪和分析算法研究  107-135
  6.1 基于视觉的运动跟踪分类与概况  107-111
    6.1.1 基于视觉的运动跟踪分类  107-108
    6.1.2 基于视觉的手势跟踪原理基础  108-110
    6.1.3 目前的研究状况  110-111
      6.1.3.1 研究进展  110-111
    6.1.4 问题的提出  111
  6.2 基于视觉的运动跟踪算法  111-114
    6.2.1 假设模型  111-112
    6.2.2 手部窗口搜索  112-113
    6.2.3 手部特征点采样  113-114
  6.3 肤色关联光流估计跟踪算法  114-122
    6.3.1 传统光流法的问题  115
    6.3.2 肤色模型、运动检测和置信度的设置  115-118
      6.3.2.1 混合肤色模型  115-116
      6.3.2.2 运动检测  116
      6.3.2.3 流估计的置信度评价问题  116-117
      6.3.2.4 搜索模式  117
      6.3.2.5 光流分割  117-118
    6.3.3 关联光流法的计算  118-122
      6.3.3.1 光流参数序列  118
      6.3.3.2 光流网格点的数目,网格点间隔下的约束  118-119
      6.3.3.3 光流搜索窗口,像素锐化率和图像取样率  119-120
      6.3.3.4 关联区域块的尺寸  120-122
  6.4 基于肤色的相干映射手势跟踪算法  122-132
    6.4.1 研究现状  122-123
    6.4.2 手部骨骼模型约束和转移矩阵  123-125
    6.4.3 手势识别的取样算法  125-128
      6.4.3.1 重点取样  125-126
      6.4.3.2 重点因子选择  126-127
      6.4.3.3 轮廓生成  127-128
    6.4.4 相干映射手部运动轨迹的提取  128
    6.4.5 手部跟踪的估计算法  128-130
    6.4.6 预测的建立  130-132
      6.4.6.1 测算法  130-131
      6.4.6.2 状态估计  131-132
  6.5 实验和讨论  132-133
    6.5.1 实验1:使用光流法进行手势跟踪  132
    6.5.2 实验2:使用向量相干映射进行手部跟踪和特征提取  132-133
  6.6 小结和讨论  133-135
7 基于视觉的英文字母手势识别系统实现  135-146
  7.1 系统概述  135-136
  7.2 系统的设计  136-140
    7.2.1 设计诸元  136-139
      7.2.1.1 界面对话设计要求  136-137
      7.2.1.2 手势模型设计  137-138
      7.2.1.3 数据输入界面设计思想  138-139
      7.2.1.4 系统的应用标准  139
    7.2.2 识别反应要求  139-140
  7.3 系统运行过程  140-145
    7.3.1 手指定位  141-142
    7.3.2 关节和角度的定位  142-143
    7.3.3 识别输出  143
    7.3.4 系统运行  143-145
  7.4 小结  145-146
8 结论与展望  146-150
参考文献  150-158
作者简历  158-161
学位论文数据集  161

相似论文

  1. 高动态GNSS软件接收机载波跟踪算法研究,P228.4
  2. 高灵敏度GNSS软件接收机的同步技术研究与实现,P228.4
  3. 分布式移动多载舰OTHR系统姿态测量方法的研究,P228.4
  4. 陀螺稳定跟踪平台研究,V241.5
  5. 电缆巡检车图像引导技术的研究,U469.6
  6. 内点法在大型电力系统无功优化中的应用研究,TM714.3
  7. 配电网故障定位与网络重构算法的研究,TM727
  8. 基于UWB脉冲信号的测距定位技术,TN929.5
  9. 带径向速度观测的跟踪算法研究,TN953
  10. 基于VRPF的机动目标跟踪的研究,TN957.52
  11. 基于直扩序列的多普勒无线定位技术研究,TN914.42
  12. 医用电磁导航实验系统的研究,TN966
  13. 多传感器组网及反隐身、抗干扰接力跟踪技术研究,TN953
  14. 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
  15. 人物言论抽取与跟踪技术研究,TP391.1
  16. 空间交会接近视觉测量方法研究,TP391.41
  17. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  18. 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
  19. 移动机器人视觉检测和跟踪研究,TP242.62
  20. 无线传感器网络中定位攻击检测技术研究,TP212.9
  21. 基于同步控制的多指手操作控制方法的研究,TP242

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com