学位论文 > 优秀研究生学位论文题录展示
一种基于密度的动态参数单元聚类算法
作 者: 鲍洪庆
导 师: 石冰
学 校: 山东大学
专 业: 计算机软件与理论
关键词: 数据挖掘 聚类 密度 动态参数 DNF.
分类号: TP301.6
类 型: 硕士论文
年 份: 2005年
下 载: 138次
引 用: 4次
阅 读: 论文下载
内容摘要
本文讨论数据挖掘中聚类的相关概念、技术和算法,在对常见聚类算法进行评价的基础上,针对密度聚类的参数选取问题,提出了一种动态参数解决方案。 目前已提出的聚类算法中,基本上都是基于“距离”的概念,不管是传统的欧氏几何距离还是其它意义上的距离,如常见的k-means、k-medoids算法,这类算法的缺点在于处理大数据集和高维数据集时不够有效,另一方面它能发现的聚类个数常常依赖于用户参数的指定,而这对用户来说经常是很困难的。 本文针对聚类算法中参数选取的问题,对参数选取问题给出了一种解决办法,提出了一种动态计算参数的算法。本文讨论的算法与已有算法的根本不同在于,它抛弃了距离的概念,采取一种新的思路,是一种基于密度的动态参数的单元聚类算法,它的优点在于能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;另一方面它能很好的处理高维数据和大数据集的数据表格。算法将最后的结果用DNF的形式表示出来。
|
全文目录
摘要 4-5 ABSTRACT 5-6 1 引言 6-14 1.1 问题研究的背景 6-7 1.2 数据挖掘的研究意义 7-12 1.3 本文的主要工作 12-14 2 聚类算法研究 14-31 2.1 聚类分析算法 14-17 2.2 算法性能的比较框架 17-22 2.2.1 算法的比较标准 17-18 2.2.2 数据变换与分类尺度 18-22 2.3 对常见聚类算法的分析 22-29 2.3.1 划分方法的特点及其问题 22-26 2.3.2 层次方法及其问题 26-27 2.3.3 基于密度的聚类算法的特点 27-28 2.3.4 基于网格的聚类算法的特点 28 2.3.5 基于模型的方法的特点 28-29 2.3.6 模糊聚类方法的特点 29 2.4 对以上算法问题的总结及横向比较 29-31 3 基于密度的动态参数聚类方法 31-46 3.1 若干定义及定理 31-34 3.2 算法中的数据预处理 34-35 3.3 动态参数的确定 35-37 3.4 数据点密度的识别问题 37-38 3.5 算法描述 38-45 3.6 算法的特点 45 3.7 本章小结 45-46 4 结束语 46-48 参考文献 48-51 致谢 51-52 攻读学位期间发表的主要学术论文 52-53 学位论文评阅及答辩情况表 53
|
相似论文
- 二甲醚在Pt低指数晶面吸附的密度泛函研究,O485
- 基于图的标志SNP位点选择算法研究,Q78
- 基于超声波的泥浆密度测试机理的研究,TE256.7
- 熔融碳酸盐燃料电池内流动过程数值分析,TM911.4
- 电流及电场对结晶器铜板上电镀镍及其合金镀层性能的影响,TQ153.2
- 基于非规则LDPC码的BICM系统优化设计,TN911.2
- LDPC码译码算法的研究,TN911.22
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 图像分割中阴影去除算法的研究,TP391.41
- 基于图分割的文本提取方法研究,TP391.41
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 大学生综合素质测评研究,G645.5
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 液芯胶囊制备特性研究及在牛奶连续接种中的应用,TS252.4
- 密度和种植方式对夏玉米茎秆抗倒伏能力的影响,S513
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com
|