学位论文 > 优秀研究生学位论文题录展示

数据挖掘中的聚类分析技术研究

作 者: 张芳
导 师: 王晓东
学 校: 国防科学技术大学
专 业: 计算机技术
关键词: 数据挖掘 聚类分析 遗传算法 K-means算法 Kohonen神经网络
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 167次
引 用: 1次
阅 读: 论文下载
 

内容摘要


伴随Internet迅猛发展的是呈指数级别增长的海量信息数据,对这些海量的数据中寻找对用户有用的信息成为一个重大的挑战,数据挖掘技术在此背景下应运而生并成为信息处理和数据技术领域的一个非常热门的研究方向。数据挖掘的目的是从海量数据中以一种人可以理解的结构抽取有用知识的过程,它涉及到数据库和数据管理、数据预处理、建模及推理、复杂度衡量、可视化、在线更新等等环节和过程。聚类分析是数据挖掘中的一个重要方法和手段,它指将物理或抽象对象集合依据对象间相似性分组为不同类别的分析过程,该方法广泛应用于数学、统计学、生物学和经济学等领域。本文对数据挖掘中的聚类技术进行了分析和讨论,系统介绍了各种聚类算法及关键技术,然后在对k-means和SOM算法的基本原理进行分析的基础上,本文给出了两种改进算法:一种是基于初始值优化和外围点消除的改进k-means算法,该改进算法有效克服了随机选择初始中心点造成的结果不可控性,提高了k-means算法对存在聚类重叠场景的适应性;一种是NOV-SOM算法:该算法通过对标准SOM算法中的每个节点单元以函数模块的形式进行替换,将其有效扩展到了非向量数据的处理中。最后,为了测试本文提出的聚类算法的性能,本文用改进k-means算法和改进SOM算法分别进行了验证实验,并对两种算法与传统算法的聚类结果进行比较,实验结果表明改进算法提高了聚类精度和收敛速度,其性能优于基本聚类算法。

全文目录


相似论文

  1. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  2. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  3. 高血压前期证候特征研究,R259
  4. 基于数据挖掘技术的保健品营销研究,F426.72
  5. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  6. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  7. 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
  8. 部队人员网上训练与考核系统的开发,TP311.52
  9. 大学生综合素质测评研究,G645.5
  10. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  11. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  12. 基于遗传算法的中短波磁天线的设计及实现,TN820
  13. 基于遗传算法的柑橘图像分割,TP391.41
  14. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  15. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  16. 基于遗传—牛顿算法的公交优化调度,TP18
  17. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  18. 南通市农业面源污染负荷研究与综合评价,X592
  19. 土壤环境功能区划研究,X321
  20. Bicluster数据分析软件设计与实现,TP311.52
  21. 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com