学位论文 > 优秀研究生学位论文题录展示

实时手势识别在人机交互中的应用

作 者: 余传义
导 师: 王林泉
学 校: 上海海事大学
专 业: 计算机软件与理论
关键词: 实时手势识别 人机交互 几何特征 决策树
分类号: TP391.4
类 型: 硕士论文
年 份: 2005年
下 载: 842次
引 用: 8次
阅 读: 论文下载
 

内容摘要


手势是人们生活当中一种自然而直观的人际交流模式,随着人机交互逐渐向以人为中心转移,对手势识别的研究也逐渐成为人们研究的热点。它为使用者提供了虚拟环境之间进行自然交互的手段,这是人们最渴望的人机接口技术。 然而,由于手势本身具有的多样性、多义性、以及时间和空间上的差异性等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性的多学科交叉研究课题。 手势分为动态手势和静态手势,动态手势定义为手运动的轨迹,而静态手势强调通过手型传递一定的意义。本文研究的实时手势识别以特定的手型表示特定的意义,同时一定的动作产生一定的结果。本文结合上海市自然科学基金资助课题“手势识别和手势合成”,对实时手势识别及其在人机交互上模拟鼠标操作的应用进行一定的研究。 本文的实时手势识别和应用的过程大致分为五个部分:视频实时采集、图像预处理、手势图像特征提取、识别和人机交互(鼠标驱动)。在视频采集部分,我们采用USB摄像头对手势进行摄取,结果为320*240像素的32位真彩色位图。在手势图像预处理部分,对采集的图像进行各种处理,包括灰度化、二值化、平滑,轮廓提取等操作。 在手势特征提取,本文采用了基于手势图像几何特征的方法,分析各种手势在图像空间的分布特征,统计像素点的直方图分布规律,最后在其中挑选了几种具有很大区分度的特征,其中既有局部特征,又有整体特征。识别方法本文采用最后通过基于拒绝策略的决策树的方法进行识别,通过对几个特征的层层决策,判定手势的类型,把识别结果通知驱动模块。最后,驱动模块比较前一帧的识别结果,用一定的判定规则最终确定相应的消息响应,形成相应的鼠标操作效果。 采用以上的方法,在实验中对一段视频的600个连续手势进行识别。在识别准确度上,各种定义手势的识别率为73.99%,而产生的交互响应正确率为100%;在时间上,系统响应延时基本保持在0.5秒之内,基本上达到人机交互的基本要求和实验的期望结果。

全文目录


第一章 引言  8-16
  1.1 手势识别概述  8-9
  1.2 手势识别的分类  9-13
    1.2.1 根据识别对象分类  9
    1.2.2 根据外围设备分类  9-10
    1.2.3 根据手势识别方法分类  10-13
  1.3 国内外相关的研究现状  13-14
  1.4 本论文的工作  14-16
第二章 视频和图像介绍  16-19
  2.1 视频采集  16-18
    2.1.1 视频的格式  16
    2.1.2 视频的采集和帧分离  16-18
  2.2 图像格式  18-19
    2.2.1 数字图像的表示  18
    2.2.2 数字图像的灰度图  18
    2.2.3 BMP图像格式  18-19
第三章 图像获取和预处理  19-28
  3.1 手势图像获取  19-20
  3.2 图像灰度化  20
  3.3 图像平滑  20-22
  3.4 手势图像的二值化  22-25
    3.4.1 人工设定整体阈值  23
    3.4.2 由灰度级直方图(Grey level histogram)确定整体阈值  23
    3.4.3 自动确定整体阈值的其他方法  23-24
    3.4.4 本文的二值化算法  24-25
  3.5 去噪  25-27
    3.5.1 八邻域方法找每个连通区域  25-26
    3.5.2 阈值剔除  26-27
  3.6 轮廓提取  27-28
第四章 手势特征提取  28-34
  4.1 几种不同的目标不变特征  29-32
    4.1.1 NMI特征  29
    4.1.2 不变矩特征  29-31
    4.1.3 比例特征  31-32
  4.2 二值图像直方图的特征提取  32
  4.3 轮廓图的形状特征提取  32-34
第五章 手势识别和窗口控制  34-47
  5.1 实时手势识别交互系统设计  35-36
  5.2 决策树简介  36-40
  5.4 三次识别判定法  40-41
  5.5 样本训练  41-45
  5.6 窗口控制模块设计  45-47
第六章 算法实现及结果分析  47-50
  6.1 系统环境  47
  6.2 交互程序运行界面  47-48
  6.3 识别结果分析  48-50
结论  50-51
发表文章  51-52
致谢  52-53
参考文献  53-55

相似论文

  1. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  2. 基于支持向量机的故障诊断方法研究,TP18
  3. 数字电视互动应用交互系统设计与实现,TP311.52
  4. 模糊聚类和决策树分类算法在高职学生就业方面的应用研究,TP399-C1
  5. 基于SOA构架的社区医疗管理系统研究与实现,TP311.52
  6. Web数据库查询结果个性化分类方法研究,TP311.13
  7. 民族面部特征提取及其识别算法研究,TP391.41
  8. 基于激光数据的移动机器人地图创建问题研究,TP242
  9. 智能教室手势识别算法研究及交互原型系统设计,TP391.41
  10. 图像纹理特征提取及分类算法研究,TP391.41
  11. 高分辨率SAR图像目标三维特征提取与建模,TN957.52
  12. 强对流天气识别系统的设计与实现,P409
  13. 便携式消费电子产品需求特征分析,F426.63
  14. 基于信用评分模型的社保征缴管理系统设计,TP311.13
  15. 数据挖掘技术在网络故障诊断中的应用研究,TP311.13
  16. 认证考试考务管理系统的研究,TP311.52
  17. 数据挖掘技术在高职就业分析中的应用研究,TP311.13
  18. 中文文本倾向性分类系统研究,TP391.1
  19. 数据挖掘技术在中测数据分析中的应用,TP311.13
  20. 基于决策树的人才管理系统的设计与实现,TP311.52
  21. 基于Web数据挖掘在个性化远程教学系统中的应用研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置
© 2012 www.xueweilunwen.com