学位论文 > 优秀研究生学位论文题录展示

一种改进的k_means聚类算法研究

作 者: 刘振广
导 师: 刘杰
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 聚类 k-means算法 网格 平均点
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 157次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络的快速发展和信息化技术的不断进步,各种数据以惊人的速度膨胀,如何从这些数据中找到有用信息,并对这些数据和信息进行分类,变得日益迫切。数据挖掘技术的出现,使得大量数据处理成为可能。聚类是一项重要数据挖掘技术,已成为研究热点之一。本文主要针对k_means算法对孤立点敏感和对初始点选择敏感的局限性,对k_means算法的聚类过程提出两点改进。首先,对k_means算法中孤立点检测问题进行深入研究,提出了基于网格的数据预处理算法。该方法对数据集网格划分之后,进行孤立点的检测。其次,分析k_means算法的初始点选择,提出了基于平均点的初始点选择算法。该方法是在基于网格的数据预处理算法基础之上,直接在网格中进行初始点的选择,使初始点更加合理和接近实际的聚类中心。最后,在k_means算法的聚类过程中,应用两个算法进行孤立点处理和初始点选择,给出了改进的k_means算法。本文通过实验对改进的k_means进行验证和分析,实验结果表明改进的k_means算法在一定程度上提高了聚类的准确率。

全文目录


相似论文

  1. 带有多项式基的径向点插值无网格方法的研究及应用,O241
  2. 联合编码调制技术中TCM与BICM方案性能研究,TN911.22
  3. BioLab面向生物计算服务的网格系统,TP399-C8
  4. 隐式用户兴趣挖掘的研究与实现,TP311.13
  5. 图像分割中阴影去除算法的研究,TP391.41
  6. 基于图分割的文本提取方法研究,TP391.41
  7. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  8. 高血压前期证候特征研究,R259
  9. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  10. K-均值聚类算法的研究与改进,TP311.13
  11. 大学生综合素质测评研究,G645.5
  12. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  13. 21个荷花品种遗传多样性的ISSR分析,S682.32
  14. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  15. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  16. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  17. 南通市农业面源污染负荷研究与综合评价,X592
  18. 土壤环境功能区划研究,X321
  19. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  20. 大豆杂种优势及其遗传基础研究,S565.1
  21. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com