学位论文 > 优秀研究生学位论文题录展示

基于蚁群算法的聚类算法研究

作 者: 黄延红
导 师: 陈敏;杨艺
学 校: 电子科技大学
专 业: 软件工程
关键词: 蚁群算法 数据挖掘 聚类分析 蚁群聚类算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 108次
引 用: 0次
阅 读: 论文下载
 

内容摘要


通过对蚂蚁觅食过程中总能找到一条从蚁巢到食物源的最短路径现象的数学建模,得到一种新的算法—蚁群算法。该算法采用正反馈并行自催化机制,具有较强的鲁棒性、优良的分布式计算机制、易于与其它算法融合的优点,对于解决大规模复杂问题表现出了优异的性能和巨大的发展潜力。计算机的广泛使用,越来越多的数据被产生。如何从中找出有用的、完整的、能够为未来决策其作用的知识是一个巨大的挑战。聚类分析总为数据挖掘的重要研究领域之一,具有极其重要的作用和地位。它能根据数据的属性对其进行分组和归类。聚类分析使得同一类中的数据具有最大相似性,不同类中的元素具有最大向异性。本文首先对聚类分析进行了详细总结和介绍,分析和总结了目前流行聚类算法的优缺点;同时介绍了聚类分析中的数据表示、相似性度量准则等内容。随后,对蚁群算法进行了详细的介绍,分析和总结了目前应用于聚类分析中的两种模型:基于蚁堆原理和基于蚂蚁觅食行为原理。本文的重点是提出了一种新的蚁群聚类算法,它利用R只蚂蚁来求解,每只蚂蚁在开始的时候均分配一个空的串S ,该串的大小为N。串S中的数值表示相应的元素被分配到的具体的哪个类。将类中心和元素分别看作是食物源和蚁巢,蚂蚁根据信息素矩阵的值进行类标识分配。为了避免陷入局部最优,一次迭代之后,采用局部搜索技术来试图跳出局部最优。反复重复上述步骤,最终得到预期的解。为了验证本文算法的有效性和优越性,文中引入遗传算法、模拟退火算法和禁忌搜索算法来进行比较实验,实验中采用两个模拟数据集和三个UCI中的数据集。实验结果表明,本文提出的蚁群聚类算法要优于其它三种随机算法。随着Web站点自身信息越来越丰富和结构越来越复杂,目前信息服务中普遍存在着“信息过载”和“资源迷向”的状况,不同的用户有不同的访问目的。因此,将蚁群聚类算法应用于Web日志挖掘,实现网站的自适应,既把从日志数据中提取的知识转换为站点的只能,使其为用户提供更有效的服务。为此,本文设计并实现了一个自适应网站的原型系统,从而验证了运用相关技术实现网站自适应是可行的。本文最后对所有工作进行了总结,并对未来工作进行了展望。

全文目录


摘要  4-6
ABSTRACT  6-11
第一章 绪论  11-21
  1.1 课题背景及意义  11-13
  1.2 研究现状  13-19
    1.2.1 聚类算法研究现状  13-16
    1.2.2 蚁群算法研究现状  16-18
    1.2.3 蚁群聚类算法的研究现状  18-19
  1.3 本文研究目标及主要研究内容  19
  1.4 章节安排  19-21
第二章 蚁群聚类算法理论基础  21-50
  2.1 数据挖掘基本原理  21-25
    2.1.1 数据挖掘的一般过程  21-22
    2.1.2 数据挖掘的一般功能  22-24
    2.1.3 数据挖掘的一般方法  24-25
    2.1.4 数据挖掘的发展  25
  2.2 聚类分析理论基础  25-43
    2.2.1 聚类分析在数据挖掘中的应用  25-26
    2.2.2 聚类分析算法的概念与基本分类  26-29
    2.2.3 距离与相似性的度量  29-31
    2.2.4 划分聚类方法  31-32
    2.2.5 k-平均算法分析  32-33
    2.2.6 PAM 算法分析  33-35
    2.2.7 改进的划分聚类算法分析  35-36
    2.2.8 层次聚类方法  36-40
    2.2.9 密度聚类方法分析  40-42
    2.2.10 其他聚类方法分析  42
    2.2.11 聚类算法的比较  42-43
  2.3 蚁群算法相关理论  43-47
    2.3.1 蚁群算法基本原理  43
    2.3.2 基本蚁群算法的数学模型  43-46
    2.3.3 基本蚁群算法的实现  46
    2.3.4 基本蚁群算法的优缺点  46-47
  2.4 蚁群聚类算法  47-49
    2.4.1 基于蚁堆原理的蚁群聚类算法  47-48
    2.4.2 基于信息熵的蚁群聚类算法  48-49
  2.5 本章小结  49-50
第三章 蚁群聚类算法  50-64
  3.1 智能算法在聚类分析中的应用  50-51
    3.1.1 神经网络在聚类分析中的应用  50
    3.1.2 遗传算法在聚类分析中的应用  50-51
  3.2 蚁群聚类算法研究  51-62
    3.2.1 算法具体描述  51-62
  3.3 本章小结  62-64
第四章 仿真实验与结果分析  64-69
  4.1 实验设计  64-65
  4.2 实验结果分析  65-68
  4.3 本章小结  68-69
第五章 WEB 日志挖掘的自适应站点原型系统  69-77
  5.1 设计思想  69
  5.2 体系结构  69-71
  5.3 离线处理部分  71-72
  5.4 在线推荐部分  72-73
  5.5 系统实现  73-76
  5.6 本章小结  76-77
第六章 总结与展望  77-79
  6.1 总结  77-78
  6.2 展望  78-79
致谢  79-80
参考文献  80-82
附录:蚁群聚类的JAVA 实现  82-96

相似论文

  1. 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
  2. 基于蚁群算法的电梯群优化控制研究,TU857
  3. 动态环境下移动对象导航系统相关技术的研究,TP301.6
  4. 基于改进蚁群算法的机器人路径规划研究,TP242
  5. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  6. 高血压前期证候特征研究,R259
  7. 基于数据挖掘技术的保健品营销研究,F426.72
  8. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  9. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  10. 大学生综合素质测评研究,G645.5
  11. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  12. 21个荷花品种遗传多样性的ISSR分析,S682.32
  13. 改进的蚁群算法及其在TSP上的应用研究,TP301.6
  14. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  15. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  16. 南通市农业面源污染负荷研究与综合评价,X592
  17. 土壤环境功能区划研究,X321
  18. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  19. 大豆杂种优势及其遗传基础研究,S565.1
  20. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  21. Bicluster数据分析软件设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com