学位论文 > 优秀研究生学位论文题录展示
数据挖掘中模糊聚类算法研究
作 者: 黄金花
导 师: 马光胜;张荣海
学 校: 哈尔滨工程大学
专 业: 软件工程
关键词: 数据挖掘 聚类分析 模糊C-均值聚类分析算法 初始化聚类 相异性度量
分类号: TP311.13
类 型: 硕士论文
年 份: 2008年
下 载: 260次
引 用: 2次
阅 读: 论文下载
内容摘要
数据挖掘不同于传统的数据处理技术,它能够从大量的信息和数据中分析和提取出有用的知识,来帮助人们做出决策。数据挖掘是目前信息领域和数据库技术的前沿研究课题,被公认为是最具发展前景的关键技术之一。作为数据挖掘主要方法之一的聚类分析技术,也随着数据挖掘技术的研究和发展,越来越受到人们的关注。聚类分析是将数据合理归类的一种方法,目前,已提出的聚类分析算法很多,本文对其中最常用的基于目标函数的模糊C-均值聚类分析算法进行了深入研究,针对其算法存在的不足,进行了一些新的改进。首先,针对模糊C-均值聚类分析算法中将数据集隶属度概率和为1的条件用于模糊性事件时,影响聚类正确率的情况,采用可能性理论作为理论基础,提出了一种新的基于隶属关系不确定的可能性改进模糊聚类算法,该算法将可能隶属度与不确定性隶属度引入到目标函数中,使得样本中的元素不局限于仅属于一个聚类,更符合现实情况。其次,针对模糊C-均值聚类分析算法中采用欧式距离进行相异性度量,只能对椭球状分布的数据进行聚类的局限性,采用马式距离进行相异性度量,同时采用输入数据矩阵化,从而能处理更多的数据模式,扩大了聚类的适用范围。为验证本论文提出的方法的有效性,对其进行了实验。从实验结果来看,达到了预期的效果。
|
全文目录
摘要 5-6 ABSTRACT 6-9 第1章 绪论 9-13 1.1 论文研究的背景及目的 9-10 1.2 国内外研究现状及成果 10-11 1.3 论文主要研究内容和组织结构 11-13 第2章 数据挖掘技术研究 13-23 2.1 数据挖掘的基本理论 13-19 2.1.1 数据挖掘的定义和功能 13-15 2.1.2 数据挖掘的基本过程 15-16 2.1.3 数据挖掘的分类 16-17 2.1.4 数据挖掘所能发现的知识 17-19 2.2 数据挖掘算法 19-22 2.2.1 关联分析算法 19-20 2.2.2 数据分类算法 20-21 2.2.3 序列分析算法 21-22 2.2.4 聚类分析算法 22 2.3 本章小结 22-23 第3章 聚类分析技术研究 23-34 3.1 聚类分析概述 23-28 3.1.1 基本概念 23-25 3.1.2 相异性度量 25-28 3.2 聚类分析算法 28-33 3.2.1 聚类算法性能的衡量指标 28 3.2.2 基于划分的聚类算法 28-30 3.2.3 基于层次的聚类算法 30-31 3.2.4 基于密度的聚类算法 31-32 3.2.5 基于网格的聚类算法 32 3.2.6 基于模型的聚类算法 32-33 3.3 本章小结 33-34 第4章 模糊聚类算法的改进 34-48 4.1 模糊聚类分析方法 34-38 4.1.1 模糊数学和模糊集基本知识 34-36 4.1.2 模糊C均值聚类算法FCM 36-38 4.2 模糊C均值聚类算法的改进 38-47 4.2.1 FCM算法改进的研究方向 39 4.2.2 改进FCM算法的提出 39-43 4.2.3 实验结果分析 43-47 4.3 本章小结 47-48 第5章 改进模糊聚类算法在入侵检测中的应用 48-64 5.1 基于数据挖掘的入侵检测技术 48-54 5.1.1 入侵检测系统原理及分类 48-50 5.1.2 常用的异常入侵检测技术 50-53 5.1.3 基于数据挖掘的入侵检测系统的优势 53-54 5.2 基于聚类分析的入侵检测过程 54-63 5.2.1 数据源分析 55-58 5.2.2 数据的预处理 58-61 5.2.3 数据的初始化聚类 61 5.2.4 实验结果分析 61-63 5.3 本章小结 63-64 结论 64-66 参考文献 66-69 攻读硕士学位期间发表论文和取得的科研成果 69-70 致谢 70-71 个人简历 71
|
相似论文
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 大学生综合素质测评研究,G645.5
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- 南通市农业面源污染负荷研究与综合评价,X592
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 大豆杂种优势及其遗传基础研究,S565.1
- 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
- 云南省直管县改革研究,D630
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|