学位论文 > 优秀研究生学位论文题录展示
基于图优化框架的数据维数约简方法及应用研究
作 者: 侯臣平
导 师: 吴翊
学 校: 国防科学技术大学
专 业: 应用数学
关键词: 维数约简 图优化框架 稳健性 半监督 子空间 高维对应
分类号: O212.1
类 型: 博士论文
年 份: 2009年
下 载: 140次
引 用: 5次
阅 读: 论文下载
内容摘要
数据的维数约简是统计学与计算机科学的新兴交叉研究方向。它所关注的问题是如何将高维数据表示在低维空间中,并由此发现其内在结构。本文从维数约简的必要性出发,在理论、方法和应用三个层次上系统地研究了维数约简问题。具体而言,本文的主要的贡献如下:1.提出了维数约简的图优化框架。将维数约简问题分为“从数据到流形”、“从流形到图”和“图上的优化准则”三个有机的部分。从理论上分析了高维数据位于低维流形上这一假设的合理性,讨论了流形上特征描述和图上特征描述的关系,并对图上的优化准则进行了深入的探讨。最后,在此框架下,对典型的维数约简方法进行了分析。此框架的提出不仅对下文中的方法和应用研究提供理论指导,而且有利于加深人们对维数约简方法本质的认识。2.在图优化框架下,对局部维数约简方法不稳健的原因进行了深入分析,通过添加全局信息和核变换,提出了稳健局部维数约简方法的框架,并对一些具体的方法进行了改进。同时,提出了局部线性变换嵌入算法,通过对数据进行局部线性变换,提高了限制最小二乘问题求解的稳定性。与原始方法相比,本文方法对噪声和参数有较高的稳健性,更加符合实际应用需求。3.从图优化框架中的构图出发,研究了数据类型不同(单视图和多视图)以及先验信息不同(正标签与负标签)情形下的维数约简问题,提出了三种半监督维数约简方法。基于调和函数的半监督维数约简方法能够有效地“扩大”先验信息量,改善维数约简方法的性能。首次研究了多视图数据的半监督维数约简问题,提出了多视图数据的半监督维数约简方法。首次提出了负标签的概念,并给出了能够有效利用负标签信息的负标签传播算法。上述研究不仅将维数约简方法扩展至半监督学习领域,而且具有广阔的应用前景。4.针对图像分类和聚类问题,通过描述图像数据的空间光滑性以及子空间基的正交性等特有性质,并充分考虑图像数据的低维流形特征,在图优化框架指导下,提出了三种基于子空间的图像分类和聚类模型。基于光滑正交子空间的图像分类模型充分考虑了图像空间光滑性与子空间基的正交性约束;在考察迹比值准则优良性、聚类标识流形光滑性以及图像空间光滑性的基础上,提出了迹比值准则下的图像聚类模型;为了在求解子空间时考察数据的非线性结构信息,首次阐述了模式收缩的概念,并提出了基于模式收缩的图像聚类模型。上述模型的提出不仅是对子空间学习研究的深化,对于指导实际图像的处理也具有重要意义。5.研究了高维对应问题,在图优化框架指导下,提出了两种基于维数约简的高维对应模型。基于最大差异延展算法的高维对应模型充分利用了最大差异延展算法的优良性能,将最大差异延展算法进行了扩展。局部近似最大差异延展高维对应模型则更加注重解决高维对应问题的实效性,并在互联网跨系统推荐中得到了应用。本文提出的模型不仅是对维数约简方法研究的有益扩展,对于解决实际问题也具有重要的指导意义。总之,本文围绕数据维数约简问题,对理论、方法和应用中的一些关键问题开展了系统的研究,构成了完整的研究体系,促进了维数约简问题研究的发展。
|
全文目录
摘要 10-12 Abstract 12-14 符号与缩略语 14-16 第一章 绪论 16-42 1.1 研究背景及意义 16-22 1.1.1 问题的提出及研究意义 16-18 1.1.2 维数约简的定义 18-19 1.1.3 维数约简方法分类 19-20 1.1.4 与其它机器学习方法的联系和区别 20-22 1.2 国内外研究现状 22-36 1.2.1 几个经典的方法 22-29 1.2.2 其它代表性维数约简方法 29-32 1.2.3 主要研究方向 32-36 1.3 论文的主要工作和结构安排 36-42 1.3.1 论文的主要工作 36-39 1.3.2 主要创新 39-42 第二章 数据维数约简的图优化框架 42-66 2.1 从数据到流形 43-49 2.1.1 高维数据不同维数的相关性 43-48 2.1.2 人类认知与数据的流形化 48-49 2.2 从流形到图 49-55 2.3 图上的优化 55-61 2.3.1 确立优化目标 55-57 2.3.2 构图 57-60 2.3.3 构建优化问题 60-61 2.4 典型维数约简方法在图优化框架下的解释 61-64 2.5 本章小结 64-66 第三章 稳健维数约简方法 66-88 3.1 稳健局部维数约简方法 66-77 3.1.1 稳健局部维数约简方法框架 66-68 3.1.2 三种典型的稳健局部维数约简方法 68-74 3.1.3 实验结果 74-77 3.2 局部线性变换嵌入 77-87 3.2.1 LLE 算法分析 78-81 3.2.2 局部线性变换嵌入 81-84 3.2.3 实验结果 84-87 3.3 本章小结 87-88 第四章 半监督维数约简方法 88-116 4.1 基于调和函数的半监督维数约简算法 88-97 4.1.1 算法推导及分析 89-94 4.1.2 实验结果 94-97 4.2 多视图数据的半监督维数约简算法 97-106 4.2.1 算法推导及分析 98-103 4.2.2 实验结果 103-106 4.3 负标签传播算法 106-115 4.3.1 NLP 算法 107-111 4.3.2 实验结果 111-115 4.4 小结 115-116 第五章 基于子空间的图像分类与聚类 116-136 5.1 基于光滑正交子空间的图像分类模型 116-123 5.1.1 OSSL 模型 117-121 5.1.2 实验结果 121-123 5.2 两种基于子空间的图像聚类模型 123-134 5.2.1 迹比值准则下的图像聚类模型 123-128 5.2.2 基于模式收缩的图像聚类模型 128-134 5.3 本章小结 134-136 第六章 高维对应问题 136-152 6.1 基于最大差异延展算法的高维数据对应模型 136-143 6.1.1 模型的建立 137-139 6.1.2 实验结果 139-143 6.2 局部近似最大差异延展高维对应模型 143-151 6.2.1 算法推导 143-146 6.2.2 实验结果 146-148 6.2.3 互联网跨系统推荐中的应用 148-151 6.3 本章小结 151-152 第七章 结束语 152-155 致谢 155-156 参考文献 156-167 作者在学期间取得的学术成果 167-168
|
相似论文
- 人工免疫分类和异常识别算法的改进,R392.1
- 新准则下公允价值计量对会计稳健性影响的研究,F233
- 债务结构对各行业会计稳健性影响的实证研究,F224
- OFDM系统信道估计技术研究,TN919.3
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- 线性算子广播信道,TN911.22
- 基于子空间的MIMO-OFDM信道估计算法设计与实现,TN919.3
- 中国民营上市公司债务融资与会计稳健性的关系研究,F275
- 基于稀疏非负矩阵分解的图像检索,TP391.41
- 废杂铜冶炼过程控制系统的设计与实现,TP273
- P2P流量识别方法研究,TP393.06
- 基于半监督哈希算法的图像检索方法研究,TP391.41
- 可变光照和遮挡条件下的人脸识别技术研究及其应用,TP391.41
- 基于子空间的小型无人旋翼机的系统辨识研究,V275.1
- 贝叶斯框架下的图像显著性检测,TP391.41
- 基于半监督学习的时间序列分类研究与实现,TP181
- DBF阵列幅相误差校准及其稳健性算法,TN820
- 数据挖掘在研究生调剂中的应用研究,TP311.13
- 新会计准则对会计盈余稳健性的影响,F233
- 外资参与与内资企业劳动生产率,F224;F276.43
- 高光谱影像混合像元分解技术研究,TP751
中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 一般数理统计
© 2012 www.xueweilunwen.com
|