学位论文 > 优秀研究生学位论文题录展示

K-means聚类优化算法的研究

作 者: 史秀岭
导 师: 姚跃华
学 校: 长沙理工大学
专 业: 通信与信息系统
关键词: 聚类算法 初值优化 K-means算法 K-means粗糙聚类算法 差分进化算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 42次
引 用: 0次
阅 读: 论文下载
 

内容摘要


聚类是数据挖掘中颇为重要的技术,其功能是按照某种准则将数据划分成组。K-means算法是一种被广泛使用的聚类算法,本文主要对该算法做深入的分析和研究。K-means算法具有简单易行、高效性等优点。但是,该算法具有对初值选择的依赖性和敏感性、易受孤立点影响、易陷入局部最优等缺点。为此,本文提出并设计了两类改进算法,主要工作内容如下:1.针对初值选择依赖性的不足,采用初值优化方法完成聚类。首先采用了一种基于密度、距离和邻域的初始化中心点的方法;然后,将其用于改进标准的K-means算法;接着,进一步结合动态聚类和粗糙聚类的思想,设计了一种K-means粗糙聚类算法。实验结果表明,改进算法在较大程度上弥补了K-means算法的不足,提高了聚类结果的稳定性和有效性。2.针对易陷入局部最优的不足,设计混合算法实现聚类。在分析和研究K-means算法与差分进化算法的特点的基础上,提出了一种基于差分进化算法的K-means聚类算法。该方法将二者有机的结合,充分发挥K-means算法的局部搜索能力和差分进化算法的全局寻优能力。实验结果表明,可以更有效的提高聚类质量。

全文目录


摘要  5-6ABSTRACT  6-9第一章 绪论  9-15  1.1 研究背景和意义  9-11  1.2 国内外研究概况  11-13    1.2.1 数据挖掘现状  11-12    1.2.2 聚类研究现状  12-13  1.3 本文工作  13-14  1.4 本文结构  14-15第二章 聚类概述  15-30  2.1 聚类  15-16    2.1.1 聚类概念  15-16    2.1.2 聚类过程  16  2.2 聚类相似性度量  16-19    2.2.1 数据结构  16-17    2.2.2 相似性度量方法  17-19  2.3 聚类准则  19-21  2.4 聚类评价  21-23  2.5 聚类方法  23-24    2.5.1 聚类方法  23    2.5.2 常用算法  23-24  2.6 K-means 算法  24-28    2.6.1 算法思想  25    2.6.2 算法流程  25    2.6.3 算法特点  25-28  2.7 聚类应用  28-29  2.8 本章小结  29-30第三章 基于初始中心点优化的K-means 粗糙聚类算法  30-46  3.1 K-means 算法对初值的依赖性  30-32  3.2 粗糙K-means 聚类算法  32-34    3.2.1 粗糙集理论  32-33    3.2.2 粗糙K-means 聚类算法  33-34  3.3 基本定义  34-35  3.4 高密度区域选取方法  35-36  3.5 初始中心点优化算法  36-37    3.5.1 算法思想  36    3.5.2 算法流程  36-37    3.5.3 算法分析  37  3.6 基于初始中心点优化的K-means 算法  37  3.7 基于初始中心点优化的K-means 粗糙聚类算法  37-39    3.7.1 基本定义  38    3.7.2 算法描述  38-39    3.7.3 算法分析  39  3.8 仿真实验  39-45    3.8.1 实验设计  40    3.8.2 实验结果与分析  40-45  3.9 本章小结  45-46第四章 基于差分进化算法的K-means 聚类算法  46-56  4.1 差分进化算法  46-50    4.1.1 研究背景  46-47    4.1.2 基本思想  47-48    4.1.3 算法特点  48-49    4.1.4 算法研究及应用  49-50  4.2 基于差分进化算法的K-means 聚类算法  50-54    4.2.1 基本思想  50-52    4.2.2 算法流程  52-53    4.2.3 复杂度分析  53-54  4.3 实验结果及分析  54-55  4.4 本章小结  55-56第五章 结论与展望  56-58  5.1 结论  56  5.2 展望  56-58参考文献  58-62致谢  62-63附录A (攻读硕士学位期间发表录用论文)  63-64详细摘要  64-70

相似论文

  1. 基于差分进化算法的JSP环境下成套订单研究,F273
  2. K-均值聚类算法的研究与改进,TP311.13
  3. 极端气象灾害下考虑不确定断线故障的电力系统随机优化调度,TM73
  4. 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. SAR干涉像对优化选取方法研究,P225.2
  9. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  10. 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
  11. 参数协进化的改进和声搜索算法及其应用,TP391.3
  12. 一个基于聚类的神经网络样本自学习系统,TP391.6
  13. 高校图书馆管理系统的个性化服务的设计与实现,TP311.52
  14. 基于显著图的交通标志检测方法研究,TP391.41
  15. 地铁建设项目施工风险评价方法与准则研究,U231.3
  16. 内源光学与微电极视觉实验平台设计,TP391.41
  17. 智能移动机器人地图描述和导航方法研究,TP242.6
  18. 基于k-means的改进聚类融合算法的研究与应用,TP311.13
  19. 基于WebService的执行力管理系统的研究与实现,TP311.52
  20. 基于补偿模糊神经网络的反应釜温度控制研究,TP183

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com