学位论文 > 优秀研究生学位论文题录展示
基于密度的聚类算法研究
作 者: 杨建红
导 师: 王欣
学 校: 长春工业大学
专 业: 计算机应用技术
关键词: 聚类分析 DBSCAN 直方图 阈值分割
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 156次
引 用: 1次
阅 读: 论文下载
内容摘要
随着互联网等现代信息技术的飞速发展,人们必须面对海量的数据和信息,如何对这些信息进行整理、分类和挖掘成为人们日益关心的话题。在数据挖掘领域中,聚类分析是一项重要的研究课题。聚类分析技术作为一种信息处理手段近年来一直受到人们的关注,聚类分析在机器学习、模式识别、数据挖掘、信息检索等很多领域得到了广泛的研究和应用。聚类算法主要分为基于划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法、基于网格的聚类算法和基于模型的聚类算法。其中基于密度的聚类的主要优点是可以发现任意形状的簇,而且对噪音数据不敏感。但不管是DBSCAN算法,还是其改进算法都要求用户输入参数,对输入参数敏感是这类算法的主要缺点之一。由于决定密度阈值的参数是全局唯一的,所以缺点之二是难以发现密度相差较大的簇。但实际上,数据对象本身属于哪个类是由它自身的属性决定的,不会因为输入参数的不同而有所不同,所以希望能有一种方法可以根据数据本身实现参数的确定。数据对象的属性直接反映在与其他对象之间的距离尤其是最近距离上,因此把这些最近距离收集起来,分析这些最近距离的频率,可以从频率形成的直方图中分析到一些有用的参数信息。图像分割理论可以对图像的灰度直方图进行阈值分割,应用到最小距离直方图中就可以对其进行阈值分割。有了这些阈值,我们就可以根据分析到的阈值对数据对象进行分别聚类,这就是本文提出的基于阈值分割和密度的聚类算法。本文的主要工作有:1、介绍了几种基于密度的聚类算法及其改进算法,并分析了当前基于密度的聚类算法存在的问题。2、对图像分割理论进行了简单介绍并详细介绍了图像处理中图像分割基本技术,尤其是基于灰度直方图的阈值分割技术。3、论述最小距离直方图的生成,并结合图像处理中的阈值分割技术对最小距离直方图进行分割,再将分割直方图用的阈值用于基于密度的聚类算法,对数据对象分别聚类、分情况聚类。
|
全文目录
摘要 2-3 Abstract 3-6 第一章 绪论 6-11 1.1 本课题的来源及研究意义 6-7 1.1.1 本课题的来源 6 1.1.2 课题的研究意义 6-7 1.2 聚类分析 7-10 1.2.1 聚类分析概述 7 1.2.2 聚类分析面临的挑战 7-8 1.2.3 聚类方法分类 8-9 1.2.4 基于密度的聚类算法 9-10 1.3 本文研究内容 10-11 第二章 基于密度的聚类算法分析 11-17 2.1 几种主要的基于密度的聚类算法 11-14 2.1.1 DBSCAN算法及其改进算法 11-12 2.1.2 OPTICS算法 12-13 2.1.3 DENCLUE算法 13 2.1.4 CLIQUE算法 13 2.1.5 其他基于密度的算法 13-14 2.2 当前基于密度的聚类算法存在的问题 14-15 2.3 本文聚类算法的基本思想 15-17 第三章 图像分割基本理论 17-23 3.1 图像分割简介 17 3.2 图像阈值分割基本技术 17-23 3.2.1 极小值点阈值 17-18 3.2.2 最优阈值 18-19 3.2.3 最大方差自动取阈法 19-21 3.2.4 直方图变换 21-23 第四章 基于阈值分割和密度的聚类算法研究 23-42 4.1 最小距离直方图 23-30 4.1.1 示例数据预处理 23-26 4.1.2 最小距离直方图的生成 26-30 4.2 最小距离直方图分析 30-34 4.2.1 Martin Ester示例数据分析 30 4.2.2 两类密度数据分析 30-33 4.2.3 多类密度数据分析 33-34 4.3 最小距离直方图阈值分割 34-36 4.3.1 阈值分割技术分析 35-36 4.3.2 最小距离直方图阈值分割 36 4.4 基于阈值分割的聚类算法 36-37 4.5 基于阈值分割和密度的聚类算法步骤 37-38 4.6 算法对比分析 38-42 第五章 总结与展望 42-43 致谢 43-44 参考文献 44-46 攻读硕士学位期间研究成果 46-47
|
相似论文
- 基于FPGA的高速图像预处理技术的研究,TP391.41
- 基于内容的服装图像检索技术研究及实现,TP391.41
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 基于统计方法的核磁共振人脑图像的分割及三维数据的分析,R445.2
- 大学生综合素质测评研究,G645.5
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于遗传算法的柑橘图像分割,TP391.41
- 南通市农业面源污染负荷研究与综合评价,X592
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 大豆杂种优势及其遗传基础研究,S565.1
- 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 结合蚁群算法与基于划分的DBSCAN聚类算法的研究,TP311.13
- 草原公路光环境对驾驶员生理指标的影响研究,U491.254
- 人脸表情识别算法研究,TP391.41
- 停车诱导在智能移动终端上的设计与实现,TN929.53
- 高密点地震信号废道自动识别及初至拾取方法研究,P631.4
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|