学位论文 > 优秀研究生学位论文题录展示
基于改进粒子群算法的聚类分析研究
作 者: 卢希
导 师: 魏延
学 校: 重庆师范大学
专 业: 计算机软件与理论
关键词: 聚类算法 粒子群算法 选择算子
分类号: TP301.6
类 型: 硕士论文
年 份: 2012年
下 载: 120次
引 用: 0次
阅 读: 论文下载
内容摘要
随着信息处理技术的发展,人们越来越倾向于选择用计算机来统计和管理数据,随之而来的是数据库的规模的不断地扩大。如何更好的提取有价值的数据信息成为当今数据处理研究的主要内容。数据挖掘技术由此应运而生,它是当前数据库和信息决策领域最前沿的研究方向之一。聚类分析作为数据挖掘的一个重要分支,目前已经在多个领域有了广泛地应用,比如于市场行情走向研究、用户行为研究、各种模式识别、大数据集分析以及图形图像的处理等领域。当前,大量的研究者从事着这一领域的研究,同时也发表了大量的文献,提出了各种各样的聚类算法,虽然算法的种类很多,但是不同的算法所针对的聚类数据类型和应用范围是些差别的。本文首先介绍数据挖掘中聚类算法和粒子群算法的基本原理及发展现状,通过对现有聚类算法的分析以及粒子群算法的优缺点分析比较,针对当前聚类算法存在对处理高维数据时易陷入局部最优等缺点对算法进行改进,研究内容如下:(1)根据基本粒子群算法原理,通过在已有改进目标函数的基础上,将进化理论运用于聚类问题求解。(2)在粒子群算法中引入克隆、选择算子寻求最优解。在同一粒子周围使用克隆选择算子进行多个方向的全局和局部搜索,促使种群中粒子快速进化,较快的得到局部最优和全局最优的位置,从而使算法特别是在处理高维数据的聚类问题时,而且能有效地避免陷入局部最优,提高了聚类算法的稳定性及可靠性。(3)通过前一部分对算法的改进研究,在本文最后,将改进后的算法与已有文献中提出的模糊聚类的改进算法(FCM)、基于PSO的模糊聚类算法(PSOFCM)以及基于克隆选择的模糊聚类算法(CSFCM)在聚类正确率方面进行比较,然后利用Eclipse集成开发软件进行仿真测试,通过测试结果来说明改进后的算法解决高维数据时在稳定性和可靠性方面的优势。
|
全文目录
摘要 3-4 ABSTRACT 4-9 1 绪论 9-15 1.1 问题的提出 9-10 1.2 国内外研究现状 10-13 1.2.1 国外研究现状 10-12 1.2.2 国内研究现状 12-13 1.3 本文的主要工作 13 1.4 论文的结构 13-15 2 数据挖掘与聚类分析基本概念 15-26 2.1 数据挖掘概述 15-18 2.1.1 数据挖掘定义 15 2.1.2 数据挖掘的应用 15-16 2.1.3 数据挖掘项目的生命周期 16-17 2.1.4 数据挖掘的任务 17-18 2.2 聚类分析的基本概念 18 2.3 聚类分析的历史和现状 18-19 2.4 聚类分析发展方向 19-20 2.5 聚类分析中的数据类型 20-23 2.5.1 区间标度变量 20-21 2.5.2 计算标准度量值 21 2.5.3 类间距离的定义 21-22 2.5.4 二元变量 22 2.5.5 标称变量 22 2.5.6 序数型变量 22 2.5.7 比例标度型变量 22 2.5.8 混合类型的变量 22-23 2.6 聚类分析的主要算法 23-25 2.6.1 划分方法 23-24 2.6.2 层次方法 24 2.6.3 基于密度的方法 24-25 2.6.4 基于网格法 25 2.6.5 基于模型法 25 2.7 本章小结 25-26 3 粒子群算法 26-33 3.1 粒子群算法概述 26-28 3.1.1 概念 26-27 3.1.2 粒子群算法的发展 27-28 3.1.3 粒子群算法的应用 28 3.2 基本粒子群算法原理 28-29 3.3 基本粒子群算法流程 29-30 3.4 与其他算法的区别 30-32 3.4.1 与基于梯度的优化算法 30-31 3.4.2 与进化算法 31 3.4.3 与蚁群算法 31-32 3.5 本章小结 32-33 4 基于改进粒子群算法的聚类分析 33-42 4.1 改进粒子群算法介绍 33-34 4.1.1 离散粒子群优化算法 33 4.1.2 小生境粒子群优化算法 33 4.1.3 混合粒子群优化算法 33-34 4.2 带克隆选择粒子的动态聚类算法 34-39 4.2.1 带克隆选择的粒子群聚类算法基本思想 35-36 4.2.2 目标函数的改进及粒子群聚类算法 36-38 4.2.3 初始类簇中心及聚类簇数的选取 38 4.2.4 编码方案 38 4.2.5 抗体-抗原亲合力函数 38 4.2.6 抗体-抗体相似度函数及抗体浓度 38-39 4.3 克隆选择算子操作 39-41 4.3.1 克隆操作中的克隆规模 39 4.3.2 基因变异操作 39-40 4.3.3 选择操作 40 4.3.4 算法流程 40-41 4.4 本章小节 41-42 5 仿真实验 42-49 5.1 仿真平台选取 42 5.2 实验数据的选取 42 5.3 参数初始设置 42-43 5.4 实验结果及分析 43-48 5.5 本章小节 48-49 6 结论与展望 49-50 6.1 本文结论 49 6.2 展望 49-50 参考文献 50-55 附录 A:作者攻读硕士学位期间发表论文及科研情况 55-56 致谢 56-57
|
相似论文
- K-均值聚类算法的研究与改进,TP311.13
- 有源电力滤波器及其在配电网中的应用,TN713.8
- 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
- 基于变异粒子群的聚类算法研究,TP18
- K-means聚类优化算法的研究,TP311.13
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- SAR干涉像对优化选取方法研究,P225.2
- 不确定环境下供应链多时段生产计划问题研究,F273
- 基于P2P网络信任机制研究,TP393.08
- 基于粒子群优化神经网络的电力短期负荷预测研究,TM715
- 数据挖掘技术在高职教师绩效考核中的应用研究,TP311.13
- 多目标柔性作业车间调度优化问题研究,O224
- 模糊C均值聚类算法的相关问题研究,TP311.13
- 针对模型失配的多目标预测控制研究,TP13
- 磨矿过程的稳态检测与优化,TD921.4
- 基于D-FNN的加热炉钢温建模与优化研究,TG334.9
- 基于粒子群优化的局部支持向量回归短期电力负荷预测建模方法研究,TM715
- 基于优化算法的风电场风能资源评估,TM614
- 蛋白质相互作用网络实验对比分析,Q51
- 改进粒子群算法及其在化工过程数据校正中的应用,TP18
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com
|