学位论文 > 优秀研究生学位论文题录展示

基于对象和动作联合建模的图像标注技术研究

作　者: 赵师聪
导　师: 魏宝刚
学　校: 浙江大学
专　业: 计算机应用技术
关键词: Group Lasso 生成模型组效应动词标注图像标注
分类号: TP391.41
类　型: 硕士论文
年　份: 2010年
下　载: 68次
引　用: 0次
阅　读: 论文下载

内容摘要

随着互联网应用的普及发展,网络上的图像信息正以指数级的速率增长。因此对海量图像进行有效的管理和检索有着非常重要的现实意义。这些互联网图像一般都有一些描述其语境的伴随文本,因此从图像伴随文本中选择合适的名词-动词去描述图像中的人物和动作成为当前热点研究问题。现有方法通常用图像中人物的外观特征学习得到表示人物和名词或者动作和动词之间概率的生成模型,然后使用这一得到的生成模型对训练集以外图像中人物运动进行识别。但是,这些方法都是单独的关注于对象或者动作的标注,没有考虑对象和动作之间存在的联系。本文提出了基于对象-动作联合建模的方法,用人脸提取的九个不同位置SIFT特征作为人物外观特征,用基于pictorial structure的人体部位概率分布作为动作的姿势特征,联合建立识别模型,实验表明通过联合建模的方法相比单独建模可以有效提高准确率。同时,在动作的识别上,当前的方法忽略了图像中高维特征之间固有存在的组效应,即同构特征之间存在较强关联性而异构特征之间关联性较弱。实际上,不同类型异构特征在图像语义理解过程中具有不同区别性,例如手臂特征对人挥手这一动作最具有区别性。本文提出了通过Group Lasso从高维异构姿势特征中选择最具区别性特征,最终学习得到生成模型的方法以识别图像中人物运动进而对其进行标注。实验结果表明,本文提出的方法对姿态变化较大动作进行识别时取得了更好结果。

全文目录

摘要  3-4
Abstract  4-9
第1章绪论  9-12
  1.1 课题背景  9
  1.2 研究内容  9-11
  1.3 本文组织结构  11
  1.4 本章小结  11-12
第2章国内外研究现状与发展趋势  12-18
  2.1 图像物体识别与标注  12-14
  2.2 人物姿势特征表达  14-17
    2.2.1 方向梯度直方图  14-16
    2.2.2 图案结构特征表示法  16-17
  2.3 本章小结  17-18
第3章基于Group Lasso的动作生成模型建立与识别  18-30
  3.1 概述  18-19
  3.2 人体姿势概率分布提取  19-21
    3.2.1 人体上身检测  19
    3.2.2 上身背景减除  19-21
    3.2.3 上身部位解析  21
  3.3 姿势特征提取与分组  21-24
    3.3.1 姿势特征提取  21-23
    3.3.2 姿势特征分组  23-24
  3.4 异构特征组系数选取  24-26
    3.4.1 Lasso  24-25
    3.4.2 Group Lasso  25-26
  3.5 姿势特征生成模型  26-29
    3.5.1 建立生成模型  26-28
    3.5.2 训练生成模型  28-29
  3.6 本章小结  29-30
第4章基于人物-动作联合生成模型的图像语义识别  30-40
  4.1 脸部区域检测  30-37
    4.1.1 正面人脸检测  30-33
    4.1.2 多视角人脸检测  33-37
  4.2 脸部特征提取  37-38
  4.3 建立联合生成模型  38-39
  4.4 本章小结  39-40
第5章实验  40-46
  5.1 数据集和评价指标  40
  5.2 动作识别结果分析  40-43
  5.3 人物-动作识别结果  43-45
  5.4 本章小结  45-46
第6章总结与展望  46-48
  6.1 总结  46
  6.2 未来研究方向  46-48
参考文献  48-52
攻读硕士学位期间主要的研究成果  52-53
致谢  53

基于对象和动作联合建模的图像标注技术研究

内容摘要

全文目录

相似论文