学位论文 > 优秀研究生学位论文题录展示

基于视觉的静态手势识别算法研究

作 者: 孔凡震
导 师: 王小平
学 校: 兰州交通大学
专 业: 模式识别与智能系统
关键词: 基于视觉的静态手势识别 VFW BP神经网络 网格特征
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 360次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着虚拟现实技术的迅猛发展,研究符合人际交流习惯的新颖人机交互技术变得异常活跃,也取得了可喜的进步。这些研究包括人脸识别、表情解释、口形(唇读)识别、头部方位检测、视线跟踪、三维定位、手势识别与人体姿势识别等等。其中,手势识别是当前比较热门的研究课题。本文对基于视觉的静态手势识别技术进行了比较深入的研究,并对其中的部分关键算法进行了改进。整个研究过程分为四大部分,即手势图像的获取、手势图像的预处理、手势图像的特征提取和手势图像的识别。具体工作如下:1.手势图像的获取方面,本文使用WINDOWS操作系统自身携带的VFW(Video forWindows)API函数,通过其AVICAP模块中的消息、宏函数、结构以及回调函数实现实时视频帧的捕获,并把得到的视频帧存放到自定义的数据结构DIBINFO中。2.手势图像的预处理方面,本文首先使用灰度直方图算法将手势图像二值化,然后根据本文提出的一种复合型去噪算法对图像消噪,再后采用掏空内部点的方法对手势目标进行轮廓提取,最后采用八邻域扫描法对手势目标进行边界跟踪。3.手势图像的特征提取方面,本文首先研究了人手的常见特征,如人手的面积、人手的矩形轮廓面积、手指(除拇指外)个数等,然后根据神经网络的特点,提出了手势图像的网格特征提取方法。4.手势图像的识别方面,本文采用了二次分类法,即首先用人手的常见特征对手势图像进行粗分类,然后用BP神经网络算法进行细分类,神经网络的输入层输入的是手势图像的网格特征,隐含层采用Sigmoid函数,输出层为四个节点。在构建手势图像的标准手势库时,采用了十种常见的手势作为标准手势。实验结果表明,本文对手势图像的二值化和去噪有较好的效果,系统的识别率和识别精度也较高。但也存在一定的问题,比如说标准手势库还不够完善,系统在复杂背景下还没有得到很好的验证。所以本文研究的手势图像识别技术,在一定程度上是对现有技术的一种改进和补充,而算法的优劣和可靠性,还有待于后续工作的继续完善和验证。

全文目录


摘要  4-5
Abstract  5-9
1 绪言  9-16
  1.1 手势识别技术的背景及研究意义  9-10
  1.2 手势识别技术的应用领域  10-11
  1.3 国内外相关领域的研究现状  11-13
    1.3.1 国外手势识别及相关领域的研究成果  11-12
    1.3.2 我国手势识别领域的研究成果  12
    1.3.3 我国手势识别领域遇到的技术难题  12-13
  1.4 基于视觉的静态手势识别简介  13-14
    1.4.1 手势建模  13
    1.4.2 静态手势图像识别的常用算法  13-14
    1.4.3 基于视觉的静态手势识别的一般过程  14
  1.5 本文的工作及论文的组织  14-16
2 手势图像的获取  16-21
  2.1 数字图像的表示  16-18
    2.1.1 数字图像的格式分类  16
    2.1.2 数字图像的灰度图  16
    2.1.3 位图格式  16-18
  2.2 CDib类库  18
  2.3 手势图像的获取  18-21
    2.3.1 VFW简介  18-19
    2.3.2 基于VFW的图像获取过程  19-21
3 手势图像预处理  21-32
  3.1 图像的基本操作  21
  3.2 图像的灰度变换  21-22
  3.3 图像的二值化  22-25
    3.3.1 整体阈值二值化  22-24
    3.3.2 局部阈值二值化  24
    3.3.3 动态阈值二值化  24
    3.3.4 算法示例  24-25
  3.4 手势图像的去噪  25-28
    3.4.1 邻域平均法  26-27
    3.4.2 中值滤波器  27
    3.4.3 频率域低通滤波  27
    3.4.4 复合型去噪法  27-28
  3.5 手势图像的边缘提取和轮廓跟踪  28-29
  3.6 手势图像的矩形区域分割  29-32
4 手势图像的特征提取  32-37
  4.1 结构特征提取  32-33
  4.2 统计特征提取  33-34
  4.3 常用的手势特征及作用  34-35
    4.3.1 手区域矩形handrect的计算算法  34
    4.3.2 Area特征的计算方法  34
    4.3.3 手势轮廓的周长  34-35
    4.3.4 fingernumber特征的提取算法  35
  4.4 网格特征提取  35-37
5 手势图像的识别  37-42
  5.1 BP神经网络算法  37-40
  5.2 系统采取的标准手势  40
  5.3 实验结果与分析  40-42
结论  42-43
致谢  43-44
参考文献  44-46
攻读学位期间的研究成果  46

相似论文

  1. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  2. 机械臂视觉伺服系统的研究,TP242.6
  3. 市级旅游用地规划环境影响评价研究,X820.3
  4. 珠三角地区高性能混凝土配合比智能化系统,TU528
  5. 大学生综合素质测评研究,G645.5
  6. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  7. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  8. 高速公路拆迁民众生存系统评价研究,D523
  9. 煤矿风险信息集成与智能预警研究,X936
  10. 基于计算机视觉的柑橘品质分级技术研究,TP391.41
  11. 基于模拟的注塑模浇注系统及成型工艺参数优化研究,TQ320.662
  12. 基于神经网络的漯河技术监督局食品安全预警系统研究,F203
  13. 基于神经网络的自适应噪声主动控制研究,TP183
  14. 数字型仪表自动识读系统研究,TP391.41
  15. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  16. 多向变异遗传算法及其优化神经网络的研究,TP18
  17. 基于因子分析和BP神经网络的风机状态诊断研究,F426.61
  18. 基于BP神经网络的GPS高程拟合模型及其应用研究,P228.4
  19. 转炉炼钢终点指导系统的研究与设计,TF345
  20. 江西省水生态承载力分析,TV213.4
  21. 基于神经网络方法的高速公路养护决策优化问题研究,U418.2;F542

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com