学位论文 > 优秀研究生学位论文题录展示
基于变异粒子群的聚类算法研究
作 者: 王东
导 师: 罗可
学 校: 长沙理工大学
专 业: 计算机应用技术
关键词: 数据挖掘 粒子群 K-均值聚类算法 变异 聚类
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 17次
引 用: 0次
阅 读: 论文下载
内容摘要
在数据挖掘中,很多工作都集中在发现能够高效地对大数据库进行聚类分析的方法上。在现有的大量聚类算法中,尤其以K-means算法应用比较广泛。K-means算法以点为原型,能够实现球形数据的聚类。该算法思想简单,易于实现,而且运行速度快,内存消耗小,能有效地处理大数据集,但是K-means聚类算法存在一些缺点:只有在初始值确定的情况下,聚类结果才是唯一确定的;算法都是局部寻优算法,容易追寻目标函数而陷入局部最优解,而且算法在一定程度上依赖于初始分类的确定,如果初始分类严重地偏离全局最优分类时,算法很容易陷入局部极小值,得到一个局部最优解。另一方面由于PSO算法结构简单,运行速度快,所以也被大量地用于聚类算法中。因此本文在前人的基础上对算法进行了改进,把两种算法进行了有机的结合。所做的工作如下:1.用变异粒子群聚类挖掘完成聚类。首先分析了粒子群算法的缺点,将粒子变异引入粒子群算法,通过增加种群的多样性来克服早熟收敛现象;其次通过对惯性权重的调整提高了算法的精度和收敛速度;最后,将K-means算法和粒子群算法结合起来形成一种混合聚类算法。该算法有效地平衡了粒子群寻优过程中的探索和开发,从而保证了粒子群算法稳定且收敛到全局最优。2.用基于种群多样性的PSO聚类挖掘算法实现聚类。首先分析现有的描述种群多样性指标的缺点;其次将基于粒子群算法的变异操作和K-means算法结合到粒子群算法中;最后,通过内部空间特性对粒子进行适当的扰动。该算法既改善了粒子群算法的局部搜索能力,又通过增加种群的多样性,避免了算法出现早熟收敛现象。3.计算机仿真。使用VC-6.0工具对提出的算法进行模拟实现,并对提出的算法与现有的成果进行比较,分析算法的优劣性。
|
全文目录
摘要 5-6ABSTRACT 6-11第一章 绪论 11-16 1.1 研究背景和意义 11-12 1.2 国内外研究现状 12-14 1.2.1 数据挖掘的研究现状 12-13 1.2.2 聚类的研究现状 13-14 1.3 本文工作 14-15 1.4 论文结构 15-16第二章 聚类 16-29 2.1 聚类概述 16-19 2.1.1 聚类的概念 16-17 2.1.2 聚类算法性能评价 17-19 2.2 距离和相似系数 19-22 2.2.1 距离 19-20 2.2.2 相似系数 20-22 2.3 聚类分析的过程 22-24 2.3.1 数据准备 23 2.3.2 特征生成 23 2.3.3 聚类分析 23-24 2.4 聚类分析算法的分类 24-26 2.4.1 划分法 24 2.4.2 层次方法 24-25 2.4.3 基于网格的方法 25 2.4.4 基于密度的方法 25 2.4.5 基于变换的聚类算法 25-26 2.4.6 基于模型的方法 26 2.5 K-means 算法 26-27 2.6 聚类分析的应用 27-28 2.7 本章小结 28-29第三章 基于变异粒子的聚类挖掘 29-45 3.1 PSO 研究背景 29-30 3.2 基本粒子群算法介绍 30-33 3.2.1 算法原理 31-32 3.2.2 基本粒子群算法描述 32 3.2.3 社会行为分析 32-33 3.3 与其它进化算法的比较 33-34 3.4 具有惯性权重的粒子群算法 34-35 3.5 基于粒子群的K-means 算法 35-38 3.5.1 PSO 算法的参数选择 35-36 3.5.2 PSO 聚类算法的编码与适应度选择 36 3.5.3 基于PSO 的K-means 算法的描述 36-38 3.6 变异粒子群算法(MK-PSO) 38 3.7 种群多样性描述 38-39 3.8 参数调整 39-40 3.8.1 惯性权重的调整 39 3.8.2 学习因子的调整 39-40 3.9 变异操作 40 3.10 算法描述 40-41 3.11 变异粒子群聚类算法的编码设计 41-42 3.11.1 MK-PSO 聚类的编码表示与适应度选择 41 3.11.2 算法设计 41-42 3.12 算法复杂度分析 42 3.12.1 空间复杂度 42 3.12.2 时间复杂度 42 3.13 仿真实验 42-44 3.14 本章小结 44-45第四章 基于种群多样性的 PSO 聚类挖掘算法 45-52 4.1 种群多样性描述 45-46 4.1.1 种群平均粒距 45 4.1.2 种群分布熵 45-46 4.1.3 均值偏差 46 4.2 调整策略 46-47 4.2.1 最大位置 46-47 4.2.2 惯性权重自适应调节 47 4.3 变异操作 47 4.4 改进后的基于种群多样性的PSO 算法 47-48 4.5 基于种群多样性的PSO 聚类算法(MPSO) 48-49 4.5.1 MPSO 算法的编码表示与适应度选择 48 4.5.2 内部空间特性 48-49 4.5.3 MPSO 聚类算法的实现步骤 49 4.6 算法复杂度分析 49-50 4.6.1 空间复杂度 49-50 4.6.2 时间复杂度 50 4.7 收敛性分析 50 4.8 仿真实验 50-51 4.9 本章小结 51-52第五章 结论与展望 52-54 5.1 结论 52 5.2 展望 52-54参考文献 54-57致谢 57-58附录 (攻读硕士学位期间发表录用论文) 58-59摘要 59-62ABSTRACT 62-65
|
相似论文
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 图像分割中阴影去除算法的研究,TP391.41
- 基于图分割的文本提取方法研究,TP391.41
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 基于粒子群算法求曲线/曲面间最小距离方法,O182
- 高血压前期证候特征研究,R259
- 中医药干预慢性心力衰竭患者心率变异性的研究,R259
- HCV准种变异特性及其免疫逃逸机制初步研究,R392.1
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- K-均值聚类算法的研究与改进,TP311.13
- 大学生综合素质测评研究,G645.5
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 污染源周边农田重金属污染风险评价与控制技术试验,X820.4
- 有源电力滤波器及其在配电网中的应用,TN713.8
- 基于GIS的植烟土壤养分分区及推荐施肥研究,S158
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|