学位论文 > 优秀研究生学位论文题录展示

扩散距离下的Kernel K-means聚类算法的改进

作 者: 赵睿
导 师: 白峰杉
学 校: 清华大学
专 业: 数学
关键词: 聚类 核K中心算法 扩散距离 非线性分类
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 58次
引 用: 0次
阅 读: 论文下载
 

内容摘要


K-means算法是聚类(Clustering)问题的经典算法,Kernel K-means算法为其改进算法,用核(Kernel)的作用代替了距离(Distance)的作用,从而从维度上改变了数据的的结构,造成数据的非线性分割,这在非线性数据的情况下往往比K-means算法分类效果好。数据上的扩散映射(Diffusion Map),可以直接导出数据之间距离的定义,称为扩散距离(Diffusion Distance)。但是由于扩散距离本身的计算存在一定的复杂度,所以些算法在时间复杂度方面并不一定存在优势。本文的研究主要分为两部分:一是如何将扩散距离应用到Kernel K-means算法中,并且旨在不过多增加算法复杂度的前提下,得到更为理想的分类结果;二是如何在数据核变换的过程中,利用数据的实验结果,学习得到扩散系数等参数,从而构造出最终的算法.

全文目录


摘要  3-4
Abstract  4-6
第1章 背景  6-11
  1.1 聚类算法分类  7-8
    1.1.1 自动化聚类  7-8
    1.1.2 半自动化聚类  8
  1.2 聚类算法的一般步骤  8-10
    1.2.1 特征提取  8-9
    1.2.2 聚类算法  9
    1.2.3 聚类的有效性  9-10
    1.2.4 给出结论  10
  1.3 本文的工作计划  10-11
第2章 理论部分  11-21
  2.1 聚类算法  11-18
    2.1.1 距离与相似度  11-12
    2.1.2 K-means 算法  12-15
    2.1.3 Kernel K-means 算法  15-16
    2.1.4 层次聚类  16-18
  2.2 扩散距离  18-21
    2.2.1 数据集上的 Markov 链  18-19
    2.2.2 扩散距离和扩散映射  19-21
第3章 算法实现  21-43
  3.1 算法的构造  21-41
    3.1.1 Kernel K-means 算法构造  21-24
    3.1.2 扩散距离的引入  24-37
    3.1.3 线性数据  37-41
  3.2 结论  41-43
参考文献  43-44
致谢  44

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 图像分割中阴影去除算法的研究,TP391.41
  3. 基于图分割的文本提取方法研究,TP391.41
  4. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  5. 高血压前期证候特征研究,R259
  6. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  7. K-均值聚类算法的研究与改进,TP311.13
  8. 大学生综合素质测评研究,G645.5
  9. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  10. 21个荷花品种遗传多样性的ISSR分析,S682.32
  11. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  12. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  13. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  14. 南通市农业面源污染负荷研究与综合评价,X592
  15. 土壤环境功能区划研究,X321
  16. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  17. 大豆杂种优势及其遗传基础研究,S565.1
  18. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  19. 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
  20. 基于遗传算法和粗糙集的聚类算法研究,TP18
  21. 基于运动目标轨迹分析的智能交通监控系统,TP277

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com