学位论文 > 优秀研究生学位论文题录展示
基于视觉的静态手势识别算法研究
作 者: 孔凡震
导 师: 王小平
学 校: 兰州交通大学
专 业: 模式识别与智能系统
关键词: 基于视觉的静态手势识别 VFW BP神经网络 网格特征
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 360次
引 用: 0次
阅 读: 论文下载
内容摘要
随着虚拟现实技术的迅猛发展,研究符合人际交流习惯的新颖人机交互技术变得异常活跃,也取得了可喜的进步。这些研究包括人脸识别、表情解释、口形(唇读)识别、头部方位检测、视线跟踪、三维定位、手势识别与人体姿势识别等等。其中,手势识别是当前比较热门的研究课题。本文对基于视觉的静态手势识别技术进行了比较深入的研究,并对其中的部分关键算法进行了改进。整个研究过程分为四大部分,即手势图像的获取、手势图像的预处理、手势图像的特征提取和手势图像的识别。具体工作如下:1.手势图像的获取方面,本文使用WINDOWS操作系统自身携带的VFW(Video forWindows)API函数,通过其AVICAP模块中的消息、宏函数、结构以及回调函数实现实时视频帧的捕获,并把得到的视频帧存放到自定义的数据结构DIBINFO中。2.手势图像的预处理方面,本文首先使用灰度直方图算法将手势图像二值化,然后根据本文提出的一种复合型去噪算法对图像消噪,再后采用掏空内部点的方法对手势目标进行轮廓提取,最后采用八邻域扫描法对手势目标进行边界跟踪。3.手势图像的特征提取方面,本文首先研究了人手的常见特征,如人手的面积、人手的矩形轮廓面积、手指(除拇指外)个数等,然后根据神经网络的特点,提出了手势图像的网格特征提取方法。4.手势图像的识别方面,本文采用了二次分类法,即首先用人手的常见特征对手势图像进行粗分类,然后用BP神经网络算法进行细分类,神经网络的输入层输入的是手势图像的网格特征,隐含层采用Sigmoid函数,输出层为四个节点。在构建手势图像的标准手势库时,采用了十种常见的手势作为标准手势。实验结果表明,本文对手势图像的二值化和去噪有较好的效果,系统的识别率和识别精度也较高。但也存在一定的问题,比如说标准手势库还不够完善,系统在复杂背景下还没有得到很好的验证。所以本文研究的手势图像识别技术,在一定程度上是对现有技术的一种改进和补充,而算法的优劣和可靠性,还有待于后续工作的继续完善和验证。
|
全文目录
摘要 4-5 Abstract 5-9 1 绪言 9-16 1.1 手势识别技术的背景及研究意义 9-10 1.2 手势识别技术的应用领域 10-11 1.3 国内外相关领域的研究现状 11-13 1.3.1 国外手势识别及相关领域的研究成果 11-12 1.3.2 我国手势识别领域的研究成果 12 1.3.3 我国手势识别领域遇到的技术难题 12-13 1.4 基于视觉的静态手势识别简介 13-14 1.4.1 手势建模 13 1.4.2 静态手势图像识别的常用算法 13-14 1.4.3 基于视觉的静态手势识别的一般过程 14 1.5 本文的工作及论文的组织 14-16 2 手势图像的获取 16-21 2.1 数字图像的表示 16-18 2.1.1 数字图像的格式分类 16 2.1.2 数字图像的灰度图 16 2.1.3 位图格式 16-18 2.2 CDib类库 18 2.3 手势图像的获取 18-21 2.3.1 VFW简介 18-19 2.3.2 基于VFW的图像获取过程 19-21 3 手势图像预处理 21-32 3.1 图像的基本操作 21 3.2 图像的灰度变换 21-22 3.3 图像的二值化 22-25 3.3.1 整体阈值二值化 22-24 3.3.2 局部阈值二值化 24 3.3.3 动态阈值二值化 24 3.3.4 算法示例 24-25 3.4 手势图像的去噪 25-28 3.4.1 邻域平均法 26-27 3.4.2 中值滤波器 27 3.4.3 频率域低通滤波 27 3.4.4 复合型去噪法 27-28 3.5 手势图像的边缘提取和轮廓跟踪 28-29 3.6 手势图像的矩形区域分割 29-32 4 手势图像的特征提取 32-37 4.1 结构特征提取 32-33 4.2 统计特征提取 33-34 4.3 常用的手势特征及作用 34-35 4.3.1 手区域矩形handrect的计算算法 34 4.3.2 Area特征的计算方法 34 4.3.3 手势轮廓的周长 34-35 4.3.4 fingernumber特征的提取算法 35 4.4 网格特征提取 35-37 5 手势图像的识别 37-42 5.1 BP神经网络算法 37-40 5.2 系统采取的标准手势 40 5.3 实验结果与分析 40-42 结论 42-43 致谢 43-44 参考文献 44-46 攻读学位期间的研究成果 46
|
相似论文
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 机械臂视觉伺服系统的研究,TP242.6
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 大学生综合素质测评研究,G645.5
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 高速公路拆迁民众生存系统评价研究,D523
- 煤矿风险信息集成与智能预警研究,X936
- 基于计算机视觉的柑橘品质分级技术研究,TP391.41
- 基于模拟的注塑模浇注系统及成型工艺参数优化研究,TQ320.662
- 基于神经网络的漯河技术监督局食品安全预警系统研究,F203
- 基于神经网络的自适应噪声主动控制研究,TP183
- 数字型仪表自动识读系统研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 多向变异遗传算法及其优化神经网络的研究,TP18
- 基于因子分析和BP神经网络的风机状态诊断研究,F426.61
- 基于BP神经网络的GPS高程拟合模型及其应用研究,P228.4
- 转炉炼钢终点指导系统的研究与设计,TF345
- 江西省水生态承载力分析,TV213.4
- 基于神经网络方法的高速公路养护决策优化问题研究,U418.2;F542
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|