学位论文 > 优秀研究生学位论文题录展示

场景图像不变特征提取及分类方法的研究

作　者: 李群
导　师: 郭军
学　校: 北京邮电大学
专　业: 信号与信息处理
关键词: 场景图像分类特征提取词激活力倒排文档频率词袋参考比较
分类号: TP391.41
类　型: 博士论文
年　份: 2013年
下　载: 327次
引　用: 0次
阅　读: 论文下载

内容摘要

图像分类是计算机视觉领域的一个基本问题,近年来已吸引了大量的关注。目前的研究往往以结合空间金字塔匹配(Spatial Pyramid Matching,SPM)的词袋(Bag-of-Words, BoW)模型为基础展开。此方案为场景图像分类提供了一个有效的捕捉图像统计信息的方式。词袋模型最初应用于自然语言处理和信息检索,是一个简化的假设。在这个模型中,不考虑语法甚至语序,把文本(如一个句子或者一个文档)表示为一个无序的词的集合。计算机视觉的研究者们从此受到启发,把该理论扩展应用到图像表示中。假定图像是一个文本,从图像提取的局部关键点特征对应于文本中的“词”。BoW表示是进一步图像处理的基础,如目标识别。此方法首先学习一个视觉词汇表(vocabulary),然后量化每一个图像的关键点特征使其成为视觉词汇表中的的某个视觉词(visual word),最后用视觉词的频率直方图表示图像。视觉词汇表也称为码书或者码本(codebook),视觉词汇相对应的称为码字(codeword)。在此过程中,往往用聚类算法(k-means)生成码书。大量的研究和学习表明,BoW模型在目标识别领域取得了令人鼓舞的成果。因此,本文以BoW模型为研究背景,主要探讨和研究图像不变特征的表示方法和场景图像分类算法。目前,码书通常是用训练集图像通过聚类方法得到。此外还有基于有监督的码书学习、核码书学习、稀疏编码等码书生成方法。利用这些方法生成的码书存在冗余的缺点。本文中,应用新近提出的激活力(Word Activation Forces, WAFs)来减少BoW模型中码书的冗余性。实验结果表明,基于WAFs的码书优化算法是有效的。通过码书的优化,图像特征表示得到改善。此外,本文提出使用软阈值-倒排文档频率(soft-Inverse DocumentFrequency,soft-IDF)优化BoW特征。给定码书和数据集,每个视觉词(码字)在特定的图像中出现的次数不同,而且出现在不同数量的图像中。一些视觉词出现频率很高,相反一些视觉词罕见的出现在几幅图像中。基于Soft-IDF的BoW特征优化方法平衡了这种不均衡性。实验表明,所提出的方法在场景图像分类中取得了令人鼓舞的效果。本文还提出基于参考比较(reference-based)的场景图像分类方法。该方法用一个参考集(reference-set)对图像进行表示,并利用该reference-set进行码书学习。联合reference-set的码书学习过程为：首先加权联合该reference-set到目标函数中,形成一个归一化的目标函数,然后用K-SVD算法优化求解,学习码书。码书生成以后,提取图像的局部限制的线性编码特征(Locality-constrained Linear Coding, LLC)表示图像。接下来,计算图像和reference-set的相似度矢量,以此矢量作为图像的最终特征。通过此过程,图像的特征空间维数显著降低。更重要的是,实验结果表明,reference-based算法实现了卓越的分类性能。Reference-based场景图像分类算法成功引入一个reference-set到码书学习和图像特征表示过程,其reference-set是每类图像中随机选取若干图像组建而成,相似度度量方法也是应用简单的距离测量。本文中,作者对该算法主要从两方面进行了改进。首先,给定更有代表性的reference-set。为此,本文改进了k-means聚类方法,在特征空间选择了一个更有代表性的reference-set。另一方面,在图像分类过程中,把reference-set的每一类看作一个社会网络,用社会网络中的中介度中心性(betweenness centrality)度量图像和reference-set的相似性。因为考虑了查询图和reference-set的整体关联性,因此该度量方法更加准确。而且不同于以往只考虑图像与图像的相似度测量,betweenness centrality引入了图像到图像类的相似度测量。通过大量的实验证实,改进算法获得了更好的性能,改进算法也成功的将社会网络的理论应用到场景图像分类领域。

全文目录

摘要  4-7
ABSTRACT  7-14
第一章绪论  14-28
  1.1 课题研究的背景及意义  14-17
    1.1.1 课题研究的背景  14-16
    1.1.2 课题研究的意义  16-17
  1.2 国内外研究现状  17-23
    1.2.1 图像特征提取研究现状  17-20
    1.2.2 图像分类方法研究现状  20-23
  1.3 论文的主要工作和研究成果  23-25
  1.4 论文结构安排  25-28
第二章场景图像分类关键技术综述  28-48
  2.1 基于BoW模型的场景图像分类方法流程  28-29
  2.2 尺度不变特征变换描述算子  29-35
    2.2.1 SIFT特征描述符的优势  30
    2.2.2 SIFT描述子提取过程  30-35
  2.3 BoW模型概述  35-42
    2.3.1 BoW模型研究现状  37-38
    2.3.2 BoW模型在图像分类中的应用方法  38-39
    2.3.3 SPM词包模型及编码方式  39-42
  2.4 图像分类的评测标准  42-45
    2.4.1 数据测试集  42-44
    2.4.2 性能评价方法  44-45
  2.5 本章小结  45-48
第三章基于WAFs的码书优化方法  48-64
  3.1 k-means聚类方法  49-53
  3.2 WAFs定义  53-55
  3.3 基于WAFs的码书优化算法  55-57
  3.4 实验  57-61
    3.4.1 数据集和参数选择  57
    3.4.2 Caltech-101  57-59
    3.4.3 Scene15  59-61
    3.4.4 PASCAL VOC2007  61
  3.5 本章小结  61-64
第四章基于soft-IDF的BoW模型的改进算法  64-74
  4.1 IDF简介  64-65
  4.2 基于Soft-IDF的词包模型优化  65-67
  4.3 码书学习方法  67-69
  4.4 实验  69-72
    4.4.1 数据集和参数设定  69
    4.4.2 Scene15  69
    4.4.3 Caltech-101  69-72
  4.5 本章小结  72-74
第五章结合K-SVD的reference-based场景图像分类算法  74-88
  5.1 Reference-combined字典学习过程  76-78
    5.1.1 重建和稀疏编码的字典学习  76
    5.1.2 Reference-combined字典学习  76-77
    5.1.3 应用K-SVD优化求解  77-78
  5.2 Reference-based分类方案介绍  78-80
    5.2.1 方案1  78-79
    5.2.2 方案2  79-80
  5.3 实验  80-86
    5.3.1 数据集和参数选择  80-82
    5.3.2 Caltech-101  82-83
    5.3.3 Scene 15  83
    5.3.4 Pascal VOC2007  83
    5.3.5 Caltech-256  83-84
    5.3.6 实验结果分析  84-86
  5.4 本章小结  86-88
第六章 Reference-based场景图像分类算法的改进方法  88-100
  6.1 改进的reference-based图像分类算法概述  89-90
  6.2 基于adapted k-means的reference-set选择方法  90-92
  6.3 中介度中心性测度计算方法  92-95
    6.3.1 中介度中心性测度应用背景  92-93
    6.3.2 中介度中心性测度在reference-based模型中的应用方法  93-95
  6.4 实验  95-97
    6.4.1 数据集和参数选择  95
    6.4.2 Caltech-101  95-96
    6.4.3 Scene15  96-97
    6.4.4 PASCAL VOC2007  97
  6.5 本章小结  97-100
第七章总结与展望  100-104
  7.1 论文工作总结  100-101
  7.2 研究展望  101-104
附录缩略语表  104-106
参考文献  106-118
致谢  118-120
攻读学位期间发表的学术论文目录  120

场景图像不变特征提取及分类方法的研究

内容摘要

全文目录

相似论文