学位论文 > 优秀研究生学位论文题录展示

流形学习的理论与方法研究

作 者: 王靖
导 师: 张振跃
学 校: 浙江大学
专 业: 计算数学
关键词: 重构权 局部切空间排列 自适应邻域选取 减少偏差 曲率和切空间
分类号: O189.33
类 型: 博士论文
年 份: 2006年
下 载: 1817次
引 用: 28次
阅 读: 论文下载
 

内容摘要


科学的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。在信息时代的科学研究过程中,不可避免的会遇到大量的高维数据,如全球气候模型、图像分类系统、文本聚类和基因序列的建模等。在实际应用中,用高维数据来表示的观测点可以模拟成可能带有噪音的低维非线性流形上的样本点或者逼近这些样本点。因此,数据降维尤其是非线性降维成为数据挖掘的一个重要手段,进行降维的目的是为了从高维空间中找出隐藏的低维结构。 过去几年来,非线性降维在包括数据挖掘、机器学习、图像分析和计算机视觉等许多研究领域都吸引了广泛的关注。最近,已经发展出一些有效的算法来进行非线性降维。这些算法包括等距映射(Isomap)、局部线性嵌入(LLE)以及它的变换形式:海赛局部线性嵌入(HLLE)和局部切空间排列(LTSA)等。所有的这些算法都有一个共同的特征:找出每个数据点周围的局部性质以及采用这些所收集到的局部性质信息将流形非线性的映射到一个低维的空间中。然而,这些算法的实现在收集邻域的局部信息以及采用这些收集的局部信息构造全局的嵌入上都是不同的。比如,Isomap利用每个邻域的邻域点之间的联系和欧氏距离在数据点上构造出一个图,并根据图距离来估计出所有数据点之间的测地距离。构造出的全局低维坐标需要保持估计的测地距离。LLE找出每个点同它的邻域点之间的一个线性组合关系,并且由此决定保持这种线性组合结构的低维嵌入。LTSA将每个点的邻域点投影到它在流形上的局部切空间上,然后排列所有的局部坐标来决定低维的全局坐标。显然的,局部几何结构的恢复效率决定了这些算法的效率。 LLE是流形学习方面经典的局部非线性方法,它有参数少、计算快、易求全局最优解等优点,并在图像分类、图像识别、谱重建、数据可视化等方面都有着广泛的应用。但是,LLE可能会将相隔较远的点映射到低维空间中邻近点的位置,从而导致嵌入结果有着比较明显的扭曲。这其中的一个重要原因是,LLE采用的单个重构权并不能完全的反映出流形的局部几何性质。此外,用以求解重构权的有约束的最小二乘问题的最优解也许不是唯一的,而且LLE采用正则化方法求解涉及到正则因子γ的选取,难以保证所求的解是最优解。这些都是LLE所面临的问题。 有一些共同的因素影响着流形学习方法的效果。流形学习方法首先面临的是邻域选取的问题,需要选取出一个合适的邻域以获取局部的线性信息,邻域选取的结果直接影响着最终的嵌入结果。很显然的,邻域越小可以认为邻域的线性结构越明显,但是我们

全文目录


摘要  3-6
Abstract  6-12
第一章 引言  12-24
  1.1 数据降维的目的和应用  12-14
  1.2 线性降维  14-17
  1.3 非线性降维  17-21
    1.3.1 流形学习中的一些数学定义  17-19
    1.3.2 流形学习  19-21
  1.4 本文的研究动机、目标和范围  21-22
  1.5 本文的主要结果  22-23
  1.6 本文的组织结构  23
  1.7 本章小结  23-24
第二章 几种流形学习方法  24-39
  2.1 Isomap:等距映射算法  24-27
  2.2 LLE:局部线性嵌入算法  27-29
  2.3 Laplacian Eigenmap:拉普拉斯特阵映射算法  29-31
  2.4 HLLE:海赛局部线性嵌入算法  31-34
  2.5 LTSA:局部切空间排列算法  34-36
  2.6 流形学习方法的异同点  36-38
  2.7 本章小结  38-39
第三章 MLLE:采用多组权的修正LLE方法  39-55
  3.1 LLE的缺点  39-42
  3.2 权向量的性质  42-47
  3.3 MLLE:修正的局部线性嵌入方法  47-50
    3.3.1 权的计算  47-49
    3.3.2 构造Φ的计算要点  49-50
  3.4 MLLE在等距流形上的分析  50-52
  3.5 与LTSA的比较  52-54
    3.5.1 邻域点的线性相关性  52-53
    3.5.2 排列矩阵  53-54
  3.6 本章小结  54-55
第四章 自适应邻域选取  55-68
  4.1 邻域选取对流形学习效果的影响  55-58
  4.2 自适应邻域选取方法  58-66
    4.2.1 切空间逼近标准  59-60
    4.2.2 邻域压缩  60-62
    4.2.3 邻域扩张  62-66
  4.3 本章小结  66-68
笫五章 自适应局部切空间排列方法  68-76
  5.1 自适应减少偏差  68-71
  5.2 理想嵌入的局部误差估计  71-73
  5.3 LTSA的修正模型  73
  5.4 估计曲率和{φ_j~(i)}  73-74
  5.5 自适应局部切空间排列  74-75
  5.6 本章小结  75-76
第六章 数值实验  76-88
  6.1 本章小节  86-88
第七章 总结和展望  88-91
参考文献  91-98
致谢  98

相似论文

  1. 基于支持向量机的非线性时间序列预测方法研究,TP181
  2. 基于流形学习的旋转机械故障诊断方法研究,TH165.3;O186.12
  3. 透镜空间上的反定向自同胚,O189.33
  4. 三维流形上的把柄添加,O189.33
  5. 一类三维流形不变量,O189.33
  6. 复Finsler流形上的几个问题,O189.33
  7. 椭圆亏格及theta函数的恒等式,O189.33
  8. 一类特征流形的奇异积分,O189.33
  9. 负pinched流形中平行平均曲率子流形的刚性定理,O189.33
  10. 关于Poisson几何里的Dirac约化,O189.33
  11. 有限群在微分流形上作用性质的研究,O189.33
  12. 辛子流形,O189.33
  13. 复超球拓扑积域特征流形上的奇异积分方程,O189.33
  14. 差分离散理论在微分子流形及可积系统中的应用,O189.33
  15. 三维流形不变量的表示,O189.33
  16. 相对映射芽的有限决定性,O189.33
  17. 子流形的Pinching问题及曲率有下界开流形的拓扑,O189.33

中图分类: > 数理科学和化学 > 数学 > 几何、拓扑 > 拓扑(形势几何学) > 解析拓扑学 > 微分流形
© 2012 www.xueweilunwen.com