学位论文 > 优秀研究生学位论文题录展示

场景图像不变特征提取及分类方法的研究

作 者: 李群
导 师: 郭军
学 校: 北京邮电大学
专 业: 信号与信息处理
关键词: 场景图像分类 特征提取 词激活力 倒排文档频率 词袋 参考比较
分类号: TP391.41
类 型: 博士论文
年 份: 2013年
下 载: 327次
引 用: 0次
阅 读: 论文下载
 

内容摘要


图像分类是计算机视觉领域的一个基本问题,近年来已吸引了大量的关注。目前的研究往往以结合空间金字塔匹配(Spatial Pyramid Matching,SPM)的词袋(Bag-of-Words, BoW)模型为基础展开。此方案为场景图像分类提供了一个有效的捕捉图像统计信息的方式。词袋模型最初应用于自然语言处理和信息检索,是一个简化的假设。在这个模型中,不考虑语法甚至语序,把文本(如一个句子或者一个文档)表示为一个无序的词的集合。计算机视觉的研究者们从此受到启发,把该理论扩展应用到图像表示中。假定图像是一个文本,从图像提取的局部关键点特征对应于文本中的“词”。BoW表示是进一步图像处理的基础,如目标识别。此方法首先学习一个视觉词汇表(vocabulary),然后量化每一个图像的关键点特征使其成为视觉词汇表中的的某个视觉词(visual word),最后用视觉词的频率直方图表示图像。视觉词汇表也称为码书或者码本(codebook),视觉词汇相对应的称为码字(codeword)。在此过程中,往往用聚类算法(k-means)生成码书。大量的研究和学习表明,BoW模型在目标识别领域取得了令人鼓舞的成果。因此,本文以BoW模型为研究背景,主要探讨和研究图像不变特征的表示方法和场景图像分类算法。目前,码书通常是用训练集图像通过聚类方法得到。此外还有基于有监督的码书学习、核码书学习、稀疏编码等码书生成方法。利用这些方法生成的码书存在冗余的缺点。本文中,应用新近提出的激活力(Word Activation Forces, WAFs)来减少BoW模型中码书的冗余性。实验结果表明,基于WAFs的码书优化算法是有效的。通过码书的优化,图像特征表示得到改善。此外,本文提出使用软阈值-倒排文档频率(soft-Inverse DocumentFrequency,soft-IDF)优化BoW特征。给定码书和数据集,每个视觉词(码字)在特定的图像中出现的次数不同,而且出现在不同数量的图像中。一些视觉词出现频率很高,相反一些视觉词罕见的出现在几幅图像中。基于Soft-IDF的BoW特征优化方法平衡了这种不均衡性。实验表明,所提出的方法在场景图像分类中取得了令人鼓舞的效果。本文还提出基于参考比较(reference-based)的场景图像分类方法。该方法用一个参考集(reference-set)对图像进行表示,并利用该reference-set进行码书学习。联合reference-set的码书学习过程为:首先加权联合该reference-set到目标函数中,形成一个归一化的目标函数,然后用K-SVD算法优化求解,学习码书。码书生成以后,提取图像的局部限制的线性编码特征(Locality-constrained Linear Coding, LLC)表示图像。接下来,计算图像和reference-set的相似度矢量,以此矢量作为图像的最终特征。通过此过程,图像的特征空间维数显著降低。更重要的是,实验结果表明,reference-based算法实现了卓越的分类性能。Reference-based场景图像分类算法成功引入一个reference-set到码书学习和图像特征表示过程,其reference-set是每类图像中随机选取若干图像组建而成,相似度度量方法也是应用简单的距离测量。本文中,作者对该算法主要从两方面进行了改进。首先,给定更有代表性的reference-set。为此,本文改进了k-means聚类方法,在特征空间选择了一个更有代表性的reference-set。另一方面,在图像分类过程中,把reference-set的每一类看作一个社会网络,用社会网络中的中介度中心性(betweenness centrality)度量图像和reference-set的相似性。因为考虑了查询图和reference-set的整体关联性,因此该度量方法更加准确。而且不同于以往只考虑图像与图像的相似度测量,betweenness centrality引入了图像到图像类的相似度测量。通过大量的实验证实,改进算法获得了更好的性能,改进算法也成功的将社会网络的理论应用到场景图像分类领域。

全文目录


摘要  4-7
ABSTRACT  7-14
第一章 绪论  14-28
  1.1 课题研究的背景及意义  14-17
    1.1.1 课题研究的背景  14-16
    1.1.2 课题研究的意义  16-17
  1.2 国内外研究现状  17-23
    1.2.1 图像特征提取研究现状  17-20
    1.2.2 图像分类方法研究现状  20-23
  1.3 论文的主要工作和研究成果  23-25
  1.4 论文结构安排  25-28
第二章 场景图像分类关键技术综述  28-48
  2.1 基于BoW模型的场景图像分类方法流程  28-29
  2.2 尺度不变特征变换描述算子  29-35
    2.2.1 SIFT特征描述符的优势  30
    2.2.2 SIFT描述子提取过程  30-35
  2.3 BoW模型概述  35-42
    2.3.1 BoW模型研究现状  37-38
    2.3.2 BoW模型在图像分类中的应用方法  38-39
    2.3.3 SPM词包模型及编码方式  39-42
  2.4 图像分类的评测标准  42-45
    2.4.1 数据测试集  42-44
    2.4.2 性能评价方法  44-45
  2.5 本章小结  45-48
第三章 基于WAFs的码书优化方法  48-64
  3.1 k-means聚类方法  49-53
  3.2 WAFs定义  53-55
  3.3 基于WAFs的码书优化算法  55-57
  3.4 实验  57-61
    3.4.1 数据集和参数选择  57
    3.4.2 Caltech-101  57-59
    3.4.3 Scene15  59-61
    3.4.4 PASCAL VOC2007  61
  3.5 本章小结  61-64
第四章 基于soft-IDF的BoW模型的改进算法  64-74
  4.1 IDF简介  64-65
  4.2 基于Soft-IDF的词包模型优化  65-67
  4.3 码书学习方法  67-69
  4.4 实验  69-72
    4.4.1 数据集和参数设定  69
    4.4.2 Scene15  69
    4.4.3 Caltech-101  69-72
  4.5 本章小结  72-74
第五章 结合K-SVD的reference-based场景图像分类算法  74-88
  5.1 Reference-combined字典学习过程  76-78
    5.1.1 重建和稀疏编码的字典学习  76
    5.1.2 Reference-combined字典学习  76-77
    5.1.3 应用K-SVD优化求解  77-78
  5.2 Reference-based分类方案介绍  78-80
    5.2.1 方案1  78-79
    5.2.2 方案2  79-80
  5.3 实验  80-86
    5.3.1 数据集和参数选择  80-82
    5.3.2 Caltech-101  82-83
    5.3.3 Scene 15  83
    5.3.4 Pascal VOC2007  83
    5.3.5 Caltech-256  83-84
    5.3.6 实验结果分析  84-86
  5.4 本章小结  86-88
第六章 Reference-based场景图像分类算法的改进方法  88-100
  6.1 改进的reference-based图像分类算法概述  89-90
  6.2 基于adapted k-means的reference-set选择方法  90-92
  6.3 中介度中心性测度计算方法  92-95
    6.3.1 中介度中心性测度应用背景  92-93
    6.3.2 中介度中心性测度在reference-based模型中的应用方法  93-95
  6.4 实验  95-97
    6.4.1 数据集和参数选择  95
    6.4.2 Caltech-101  95-96
    6.4.3 Scene15  96-97
    6.4.4 PASCAL VOC2007  97
  6.5 本章小结  97-100
第七章 总结与展望  100-104
  7.1 论文工作总结  100-101
  7.2 研究展望  101-104
附录 缩略语表  104-106
参考文献  106-118
致谢  118-120
攻读学位期间发表的学术论文目录  120

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  7. 空间交会接近视觉测量方法研究,TP391.41
  8. 图像实时采集、存储与处理方法研究,TP391.41
  9. 唇读中的特征提取、选择与融合,TP391.41
  10. 多币种纸币处理技术的研究与实现,TP391.41
  11. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  12. 移动机器人视觉检测和跟踪研究,TP242.62
  13. 基于随机森林的植物抗性基因识别方法研究,Q943
  14. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  15. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  16. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  17. 红外图像目标识别及跟踪技术研究,TP391.41
  18. 水下目标特征的压缩与融合技术研究,TN911.7
  19. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  20. 基于模糊聚类的图像检索方法研究及其系统实现,TP391.41
  21. 基于“词袋”模型的图像分类系统,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com