学位论文 > 优秀研究生学位论文题录展示
高维数据空间中离群点检测方法的研究
作 者: 李威
导 师: 苑森淼
学 校: 吉林大学
专 业: 计算机软件与理论
关键词: 数据挖掘 离群点 聚类 超图分割 模式
分类号: TP311.13
类 型: 硕士论文
年 份: 2005年
下 载: 291次
引 用: 1次
阅 读: 论文下载
内容摘要
本文是对数据挖掘中的一个问题——离群点检测的研究,首先分析了现有离群数据挖掘方法在发现低维数据空间和小规模数据集中离群点的弊端,然后给出了两种基于高维大数据集的离群点检测方法。第一种是基于有权重超图模型的离群点检测方法。方法中使用了基于有权重支持度框架的关联规则挖掘方法,将数据集映射成超图模型,通过定义超图中的基本概念和离群点检测标准发现数据集中的离群数据。与其他方法不同,本方法能够结合用户的意愿和实际应用挖掘出更有意义的离群点。第二种是基于数据模式聚类的离群点检测方法。方法中定义了事务包含模式的含义,并给出了基于超图分割的模式聚类方法,然后使用基于聚类的局部离群因子的定义,找出数据集中满足用户要求的离群点。本方法使用了适合应用在高维空间中的聚类方法,发现的是基于聚类的局部离群点,因此更具有效性和合理性。
|
全文目录
第一章 绪论 7-13 1.1 数据挖掘知识概述 7-8 1.2 离群数据发现 8-11 1.2.1 离群数据的定义 8-9 1.2.2 离群数据挖掘的主要方法 9-10 1.2.3 高维空间中的离群点发现 10-11 1.3 本文的主要工作 11-13 第二章 基于有权重支持度框架的关联规则挖掘 13-23 2.1 关联规则的基本概念 13-14 2.2 关联规则的主要分类 14-15 2.3 基于有权重支持度框架的关联规则挖掘方法 15-22 2.3.1 概念介绍 16-19 2.3.2 有权重向下封闭性质 19-22 2.4 本章小结 22-23 第三章 基于有权重超图的离群点检测 23-38 3.1 问题的提出 23-24 3.2 问题定义 24-29 3.3 WHOT算法 29-34 3.3.1 建立超图模型 29-31 3.3.2 聚类 31-32 3.3.3 测试离群点 32-33 3.3.4 复杂度分析 33-34 3.4 实验与分析 34-36 3.4.1 数据预处理 34-35 3.4.2 实验结果与分析 35-36 3.5 本章小结 36-38 第四章 基于数据模式聚类的离群点检测 38-54 4.1 问题提出 38-40 4.2 算法描述 40-52 4.2.1 基于模式的聚类算法 40-48 4.2.2 基于数据模式聚类算法的离群点检测 48-51 4.2.3 复杂度分析 51-52 4.3 实验与分析 52-53 4.4 本章小结 53-54 第五章 总结与展望 54-56 5.1 总结 54-55 5.2 展望 55-56 参考文献 56-62 摘要 62-64 ABSTRACT 64-67 致谢 67-68 导师及作者简介 68
|
相似论文
- 基于流形学习的高维流场数据分类研究,V231.3
- 溃坝生命损失风险评价的关键技术研究,TV122.4
- 基于新医学模式的儿童医疗环境设计研究,TU246.1
- 万科模式的居住小区设计研究,TU984.12
- 径向振动模式压电变压器的等效电路模型与应用,TM406
- 任务型教学在农村初中英语教学中的应用研究,H319
- 云南少数民族题材影视作品的叙事模式分析,J905
- 高中函数教学研究与实践,G633.6
- 高中政治新课程改革课堂教学模式整合探索,G633.2
- 海量多数据库集成系统的查询处理研究,TP311.13
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 图像分割中阴影去除算法的研究,TP391.41
- 基于图分割的文本提取方法研究,TP391.41
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- “小团队”健美操教学模式改善高职院校女生心理健康状况的研究,G831.3
- 高血压前期证候特征研究,R259
- 山东省高校科研项目集成管理模式研究,G644
- 技师培养方式改革的研究,G719.2
- 基于数据挖掘技术的保健品营销研究,F426.72
- 社会消费方式变迁下的服装终端空间变化之研究,TS941.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|