学位论文 > 优秀研究生学位论文题录展示
面向图像检索和分类任务的稀疏特征学习
作 者: 徐望明
导 师: 方康玲
学 校: 武汉科技大学
专 业: 控制理论与控制工程
关键词: 稀疏特征学习 视觉词典 特征编码 特征集成 非负性约束 异质局部特征
分类号: TP391.41
类 型: 博士论文
年 份: 2013年
下 载: 160次
引 用: 0次
阅 读: 论文下载
内容摘要
高维度和稀疏性是当今机器学习研究领域的重要话题。图像的稀疏表示是当前信息科学飞速发展、图像数据急剧增加的形势下对图像表示问题的研究热点。稀疏性能有效解决实际应用中图像这种高维数据在存储容量、处理速度和数据本身的可解释性等方面存在的问题。为了适应大规模基于内容的图像检索和图像分类任务的应用需求,本文在提取图像局部特征的基础上,研究了无监督的特征学习方法来获得图像的全局超完备稀疏表示,使之同时具备了全局特征和局部特征的优势。本文的主要研究工作包括:对图像局部特征提取技术进行综述,介绍了一些有代表性的局部特征提取算法(包括特征检测算子和描述算子),指出了局部特征的应用场合,引出了本文的研究动机。针对图像局部特征集表示在大规模图像检索和分类应用中的局限性,研究了基于视觉词袋(BoVW)模型的图像稀疏表示方法,该方法以特征量化为核心思想,其关键技术包括基于聚类分析的视觉词典构造、基于向量量化技术的特征编码等。针对BoVW模型中特征量化误差较大的问题,研究了基于稀疏编码(SC)模型的图像稀疏表示方法,该方法以稀疏重构为基本准则,其关键技术涉及超完备视觉词典学习、稀疏分解和编码集成等。针对SC模型中稀疏性正则化函数不平滑及计算复杂度较高的问题,研究了基于局部编码(LC)模型的图像稀疏表示方法,该方法以流形学习为理论基础,用局部性约束替代稀疏编码中的稀疏性约束,以局部重构的方式实现了高效的特征编码,形成图像的稀疏表示。综合以上三种图像稀疏表示模型,建立并推广了图像稀疏特征学习的统一框架,探讨了各种模型在此统一框架下的具体表现形式和实现方法,提出了一种基于图像异质局部特征的稀疏学习方法。本文以基于内容的图像检索和图像分类任务为应用背景,在ZuBud、UKBench、Caltech-101、Scene15等标准数据库上验证并评价了所研究的稀疏特征学习方法。本文的主要贡献在于:提出了一种基于谱聚类的视觉词典构造方法,谱聚类可在任意分布的样本空间收敛到全局最优,避免了K-Means和HKM聚类算法对初始聚类中心敏感和局部最优的问题;提出了一种在优化函数中施加非负性约束来增强图像稀疏特征学习性能的策略,对标准稀疏编码(SC)模型进行改进,建立了非负稀疏编码(NNSC)模型,对局部编码(LC)模型中的LLC编码方法进行改进,提出了非负LLC(NNLLC)编码方法;提出了一种改进的基于向量差分运算的局部编码方法,即局部差分编码(LDC),仅用图像局部特征的近邻视觉单词来构造差分基向量用于后续编码,以保持其局部平滑性,将视觉单词之间的关系融合到最终的特征编码中;提出了一种改进的特征集成策略,即kMaxSum Pooling,考虑图像中所有局部特征相对于视觉词典中某个视觉单词的前k个最大响应,并求其和响应,选择合适的k值后在图像检索实验中取得了比Max Pooling和Sum Pooling更好的效果;从三种稀疏表示模型的联系出发,建立了图像稀疏特征学习的统一框架,并引入图像异质局部特征的概念推广了该框架,提出了一种基于图像异质局部特征的稀疏学习方法形成图像的多角度全局稀疏表示,提升了图像检索和图像分类的性能。
|
全文目录
摘要 4-6 Abstract 6-8 目录 8-12 第一章 绪论 12-23 1.1 本课题的研究背景及意义 12-14 1.2 本课题的发展及研究现状 14-20 1.2.1 图像检索和图像分类系统的工作原理 14-15 1.2.2 图像检索和图像分类技术的发展及现状 15-17 1.2.3 基于特征的图像表示方法的发展及研究现状 17-20 1.3 论文的主要研究内容及创新点 20-22 1.4 论文的结构安排 22-23 第二章 图像局部特征提取技术综述 23-36 2.1 引言 23-24 2.2 图像局部特征及其性质 24-26 2.3 局部特征检测算子 26-30 2.3.1 Harris 和 Hessian 检测算子 26-27 2.3.2 Harris-Laplace 和 Harris-Affine 检测算子 27-28 2.3.3 Hessian-Laplace 和 Hessian-Affine 检测算子 28 2.3.4 LoG 和 DoG 检测算子 28 2.3.5 SURF 检测算子 28-29 2.3.6 MSER 检测算子 29 2.3.7 区域采样 29-30 2.4 局部特征描述算子 30-34 2.4.1 SIFT 描述算子 30-32 2.4.2 SURF 描述算子 32-33 2.4.3 LBP 描述算子 33-34 2.4.4 HOG 描述算子 34 2.5 图像局部特征的应用 34-35 2.6 本章小结 35-36 第三章 基于视觉词袋模型的图像稀疏表示方法 36-55 3.1 引言 36-37 3.2 BOVW 模型表示图像的基本概念和关键技术 37-41 3.2.1 基本概念 37-39 3.2.2 BoVW 模型表示图像的关键技术 39-41 3.3 基于聚类分析的视觉词典构造方法 41-48 3.3.1 基于 K-Means 聚类的视觉词典构造 41-43 3.3.2 基于层次 K-Means(HKM)聚类的视觉词典构造 43-45 3.3.3 基于谱聚类(Spectral Clustering)的视觉词典构造 45-48 3.4 基于向量量化技术的特征编码方法 48-50 3.4.1 特征向量硬量化方法(Hard-VQ) 48-49 3.4.2 特征向量软量化方法(Soft-VQ) 49 3.4.3 量化编码的集成 49-50 3.5 弱几何约束:SPM-BOVW 模型 50-51 3.6 本章实验及结果 51-54 3.7 本章小结 54-55 第四章 基于稀疏编码模型的图像稀疏表示方法 55-81 4.1 引言 55-56 4.2 稀疏编码模型的基本概念和关键技术 56-60 4.2.1 基本概念 56-58 4.2.2 SC 模型表示图像的关键技术 58-60 4.3 稀疏分解算法 60-65 4.3.1 松弛算法基追踪(BP) 61 4.3.2 贪婪算法匹配追踪(MP) 61-63 4.3.3 高效算法特征符号搜索(FSS) 63-65 4.4 视觉词典学习方法 65-69 4.4.1 通用的词典学习过程 65-66 4.4.2 最优方向法(MOD) 66-67 4.4.3 拉格朗日对偶法 67-68 4.4.4 K-SVD 算法 68-69 4.5 局部特征的稀疏编码集成方法 69-71 4.5.1 常用的特征集成方法 69-70 4.5.2 空间集成方法:SPM-SC 模型 70-71 4.6 SC 模型的非负约束改进: NNSC 模型 71-76 4.6.1 从 NMF 到 NNSC 71-72 4.6.2 Hoyer 的 NNSC 学习算法 72-74 4.6.3 NNSC 图像表示模型 74 4.6.4 BoVW 模型、SC 模型及 NNSC 模型的比较及思考 74-76 4.7 本章实验及结果 76-79 4.7.1 图像检索实验及结果 76-78 4.7.2 图像分类实验及结果 78-79 4.8 本章小结 79-81 第五章 基于局部编码模型的图像稀疏表示方法 81-100 5.1 引言 81 5.2 局部编码的理论基础 81-84 5.2.1 数据流形 81-82 5.2.2 流形学习 82-83 5.2.3 局部线性嵌入(LLE) 83-84 5.3 图像特征稀疏学习的局部编码方法 84-89 5.3.1 局部坐标编码(LCC) 84-85 5.3.2 局部约束线性编码(LLC) 85-87 5.3.3 非负稀疏局部线性编码(NSLLC) 87-89 5.3.4 非负 LLC 编码(NNLLC) 89 5.3.5 特征编码集成 89 5.4 基于向量差分运算的局部编码方法 89-93 5.4.1 局部超球面编码(LHC) 90-92 5.4.2 局部差分编码(LDC) 92-93 5.5 本章实验及结果 93-99 5.5.1 图像检索实验及结果 93-96 5.5.2 图像分类实验及结果 96-99 5.6 本章小结 99-100 第六章 图像稀疏特征学习的统一框架及推广 100-116 6.1 引言 100 6.2 图像稀疏特征学习的统一框架 100-109 6.2.1 稀疏学习的目的及实现过程 100-102 6.2.2 稀疏学习的统一框架 102-104 6.2.3 稀疏表示模型在统一框架下的具体形式 104-106 6.2.4 图像检索和分类应用中的相似性度量及分类器训练 106-109 6.3 基于图像异质局部特征的稀疏学习及其应用 109-115 6.3.1 异质局部特征及其稀疏学习 110-112 6.3.2 应用于图像检索 112-113 6.3.3 应用于图像分类 113-115 6.4 本章小结 115-116 第七章 总结与展望 116-120 7.1 本文的工作总结 116-118 7.2 进一步的工作展望 118-120 参考文献 120-126 致谢 126-127 攻读博士学位期间发表论文及参与科研情况 127
|
相似论文
- 超硬材料工具CAD/CAPP集成系统关键技术研究,TP391.72
- 基于多特征集成的图像自动标注方法研究,TP391.41
- 基于多特征集成分类器的人脸表情识别研究,TP391.41
- 基于模型分割和特征集成的三维模型检索方法研究,TP391.41
- 基于核函数的集成学习算法研究与应用,TP391.41
- 蛋白质名字识别系统的研究与实现,TP391.4
- 基于SE软件的几何特征和工艺特征的集成研究,TP391.7
- 图像数据的视觉显著性检测技术及其应用,TP391.41
- 特征描述方法在软件缺陷预测中的应用研究,TP311.53
- 面向数据流挖掘的集成分类模型研究,TP311.13
- 基于视频和三维动作捕捉数据的人体动作识别方法的研究,TP391.41
- 基于多特征融合的视频拷贝检测技术研究,TP391.41
- 基于弱随机映射的目标检索技术研究,TP391.41
- 基于内容的保护动物图像检索关键技术研究,TP391.41
- 基于特定目标的大规模图像检索技术研究,TP391.41
- 基于形状的图像特征分析与检索技术研究,TP391.41
- 混合人工自然特征环境的单目视觉SLAM,TP242
- 大型天线结构协同设计关键技术研究,TN820
- 集成学习下的图像分析关键问题研究,TP391.41
- 基于特征集成的人脸图像年龄自动估计方法研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|