学位论文 > 优秀研究生学位论文题录展示

基于遗传算法的K-means聚类方法的研究

作 者: 吴香庭
导 师: 路燕
学 校: 山东科技大学
专 业: 情报学
关键词: 数据挖掘 聚类分析 遗传算法 K-means算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 312次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据挖掘是随着信息技术不断发展而形成的一门新兴的交叉学科,是信息处理和数据库技术领域的前沿研究课题。聚类分析是数据挖掘的一个非常重要的研究分支。聚类是一种无监督的分类方法,目标是在没有任何先验知识的情况下,将数据集划分成不同的类,使得不同类中的对象尽可能相异,相同类中的对象尽可能相似。K-means算法作为聚类分析中的经典算法现已被广泛应用在商务、市场分析、生物学、文本分类等领域。K-means聚类算法具有较强的局部搜索能力,但是对初始聚类中心敏感,容易陷入局部最优,影响了聚类结果。而遗传算法是一种高效的全局搜索方法,它的局部搜索能力较差。本文将K-means聚类算法与遗传算法相结合,互相取长补短,提出了一种基于遗传算法的K-means聚类算法(KBGA),并通过实验验证了算法的有效性。本文工作主要体现在以下几个方面:首先,详细介绍了K-means聚类算法,分析了K-means聚类算法的优缺点,并在此基础上,提出了解决缺点的方法。其次,介绍了数据挖掘中的一个重要算法——遗传算法。对遗传算法的概念、组成、应用流程、应用中的问题等进行了详细描述。再次,提出了一种改进的遗传K-means聚类算法(KBGA)。由于传统的K-means算法对初始聚类中心非常敏感,本文提出了一种基于相似度的最小最大原则的方法来选取初始聚类中心,并提出了一种相应的改进的K-means聚类算法(IKA)。另外由于K-means聚类的初始聚类数K的选择也是是影响聚类的一个重要参数。为了获得高精度的聚类结果,基于遗传算法和K-means算法的特点,本文提出了一种基于遗传算法的求K值方法,从编码方法、适应度函数的构造、选择算子、交叉算子和变异算子的设计等方面进行了改进。最后,为了测试本文提出的聚类算法的性能,本文通过实验对两种算法的聚类结果进行比较,实验结果表明本文算法能够有效地解决聚类问题。

全文目录


摘要  5-6
ABSTRACT  6-12
1 绪论  12-17
  1.1 研究背景  12-14
  1.2 研究现状  14-15
  1.3 论文的主要内容  15-16
  1.4 小结  16-17
2 K-MEANS聚类算法  17-24
  2.1 算法解释  17-19
  2.2 算法描述  19-20
  2.3 算法的特点  20-22
  2.4 小结  22-24
3 遗传算法简介  24-36
  3.1 遗传算法的概念  24-25
  3.2 遗传算法的组成  25-30
  3.3 遗传算法的基本原理  30-35
  3.4 小结  35-36
4 一种基于遗传算法的K-MEANS聚类算法(KBGA)  36-54
  4.1 基于相似度的初始聚类中心选取算法  36-40
  4.2 改进的K-means聚类算法(IKA)  40-45
  4.3 K值学习的遗传算法设计  45-53
  4.4 小结  53-54
5 实验结果与分析  54-58
  5.1 实验平台  54
  5.2 实验分析  54-57
  5.3 小结  57-58
6 结论与展望  58-60
  6.1 论文的主要工作  58
  6.2 进一步的努力方向  58-60
致谢  60-61
攻读硕士期间主要成果  61-62
参考文献  62-65

相似论文

  1. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  2. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  3. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  4. 高血压前期证候特征研究,R259
  5. 基于数据挖掘技术的保健品营销研究,F426.72
  6. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  7. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  8. 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
  9. 部队人员网上训练与考核系统的开发,TP311.52
  10. 大学生综合素质测评研究,G645.5
  11. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  12. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  13. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  14. 21个荷花品种遗传多样性的ISSR分析,S682.32
  15. 基于遗传算法的中短波磁天线的设计及实现,TN820
  16. 基于遗传算法的柑橘图像分割,TP391.41
  17. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  18. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  19. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  20. 基于遗传—牛顿算法的公交优化调度,TP18
  21. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com