学位论文 > 优秀研究生学位论文题录展示

基于对象和动作联合建模的图像标注技术研究

作 者: 赵师聪
导 师: 魏宝刚
学 校: 浙江大学
专 业: 计算机应用技术
关键词: Group Lasso 生成模型 组效应动词标注 图像标注
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 68次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网应用的普及发展,网络上的图像信息正以指数级的速率增长。因此对海量图像进行有效的管理和检索有着非常重要的现实意义。这些互联网图像一般都有一些描述其语境的伴随文本,因此从图像伴随文本中选择合适的名词-动词去描述图像中的人物和动作成为当前热点研究问题。现有方法通常用图像中人物的外观特征学习得到表示人物和名词或者动作和动词之间概率的生成模型,然后使用这一得到的生成模型对训练集以外图像中人物运动进行识别。但是,这些方法都是单独的关注于对象或者动作的标注,没有考虑对象和动作之间存在的联系。本文提出了基于对象-动作联合建模的方法,用人脸提取的九个不同位置SIFT特征作为人物外观特征,用基于pictorial structure的人体部位概率分布作为动作的姿势特征,联合建立识别模型,实验表明通过联合建模的方法相比单独建模可以有效提高准确率。同时,在动作的识别上,当前的方法忽略了图像中高维特征之间固有存在的组效应,即同构特征之间存在较强关联性而异构特征之间关联性较弱。实际上,不同类型异构特征在图像语义理解过程中具有不同区别性,例如手臂特征对人挥手这一动作最具有区别性。本文提出了通过Group Lasso从高维异构姿势特征中选择最具区别性特征,最终学习得到生成模型的方法以识别图像中人物运动进而对其进行标注。实验结果表明,本文提出的方法对姿态变化较大动作进行识别时取得了更好结果。

全文目录


摘要  3-4
Abstract  4-9
第1章 绪论  9-12
  1.1 课题背景  9
  1.2 研究内容  9-11
  1.3 本文组织结构  11
  1.4 本章小结  11-12
第2章 国内外研究现状与发展趋势  12-18
  2.1 图像物体识别与标注  12-14
  2.2 人物姿势特征表达  14-17
    2.2.1 方向梯度直方图  14-16
    2.2.2 图案结构特征表示法  16-17
  2.3 本章小结  17-18
第3章 基于Group Lasso的动作生成模型建立与识别  18-30
  3.1 概述  18-19
  3.2 人体姿势概率分布提取  19-21
    3.2.1 人体上身检测  19
    3.2.2 上身背景减除  19-21
    3.2.3 上身部位解析  21
  3.3 姿势特征提取与分组  21-24
    3.3.1 姿势特征提取  21-23
    3.3.2 姿势特征分组  23-24
  3.4 异构特征组系数选取  24-26
    3.4.1 Lasso  24-25
    3.4.2 Group Lasso  25-26
  3.5 姿势特征生成模型  26-29
    3.5.1 建立生成模型  26-28
    3.5.2 训练生成模型  28-29
  3.6 本章小结  29-30
第4章 基于人物-动作联合生成模型的图像语义识别  30-40
  4.1 脸部区域检测  30-37
    4.1.1 正面人脸检测  30-33
    4.1.2 多视角人脸检测  33-37
  4.2 脸部特征提取  37-38
  4.3 建立联合生成模型  38-39
  4.4 本章小结  39-40
第5章 实验  40-46
  5.1 数据集和评价指标  40
  5.2 动作识别结果分析  40-43
  5.3 人物-动作识别结果  43-45
  5.4 本章小结  45-46
第6章 总结与展望  46-48
  6.1 总结  46
  6.2 未来研究方向  46-48
参考文献  48-52
攻读硕士学位期间主要的研究成果  52-53
致谢  53

相似论文

  1. 长文本辅助短文本的知识迁移聚类方法,TP391.1
  2. 基于稀疏回归模型的图像标注研究,TP391.41
  3. 基于稀疏表示的脱机手写体汉字识别研究,TP391.1
  4. 面向图像标注的图像分割与特征提取技术研究,TP391.41
  5. CG图像和相机图像的检测与分类标注,TP391.41
  6. 基于机器学习算法的自动图像标注,TP391.41
  7. 基于Semi-CCA的自动图像标注研究,TP391.41
  8. 基于本体的材料腐蚀特征信息检索模型及应用技术研究,TP391.41
  9. 基于本体的图像检索技术研究,TP391.3
  10. 基于场景语义图像标注关键技术的研究,TP391.41
  11. 基于图学习的唐卡图像自动标注技术研究,TP391.41
  12. 基于区域特征的有监督图像语义标注,TP391.41
  13. 多层感知器神经网络的局部泛化误差模型,TP183
  14. 嵌入式软件模型的分布式代码生成及应用,TP311.52
  15. 网络集群行为研究,G206
  16. 基于语义上下文建模的图像语义自动标注研究,TP391.41
  17. 融合视觉与语义双模态信息的自动图像标注,TP391.41
  18. 基于用户交互的web图像标注框架设计与实现,TP391.41
  19. 自然场景图像的自动标注方法研究,TP391.41
  20. 融合颜色词描述的自动图像标注算法研究与实现,TP391.41
  21. 结合D-S证据理论与多SVMs的图像标注和检索,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com