学位论文 > 优秀研究生学位论文题录展示
面向社区服务的数据挖掘关键技术研究与实现
作 者: 叶小旺
导 师: 刘志镜
学 校: 西安电子科技大学
专 业: 计算机应用技术
关键词: 数据挖掘 关联规则 动态数据 时间划分
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 55次
引 用: 0次
阅 读: 论文下载
内容摘要
关联规则挖掘实数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种有趣关联或相关联系。近年来,关联规则挖掘研究称为数据挖掘中的一个热点,并被广泛应用于市场营销、事务分析等领域。以往的许多研究都将关联规则视为永恒有效的,没有考虑到规则的变化,这种规则是一种静态的规则。实际上,数据特性和规则可能都会随着时间的推移产生很大的变化,因此,实时维护规则的有效性显得尤为必要。本文对经典关联规则挖掘算法进行了系统的研究和全面的总结,在此基础上提出了基于动态数据的新关联规则挖掘及更新算法,通过数据挖掘系统平台进行了算法的设计与实现。本文首先介绍了数据挖掘的基本任务和技术,重点介绍了关联规则挖掘的三种经典算法:Apriori算法、close算法以及FP-Growth算法。并对Apriori算法的改进、FP-Growth算法的优缺点进行了全面综合的分析。其次,本文详细介绍动态数据关联规则算法核心思想,体系结构,算法挖掘的基本步骤以及算法的伪代码实现。对算法的特点和关联算法性能评价标准进行了全面而细致的描述。最后,在对关联规则挖掘算法进行分析和总结的基础之上,利用数据挖掘服务软件系统实现了动态数据关联规则挖掘算法的设计与封装,并且进行了算法的性能测试。通过实验性能结果我们可以知道该算法挖掘效率更高,通过相应的评价指标充分考虑了动态数据的时间特性,非常适合于面向主题的动态数据挖掘,具有良好的可扩展性。
|
全文目录
摘要 3-4 Abstract 4-7 第一章 绪论 7-11 1.1 研究背景及意义 7-8 1.2 国内外研究现状 8-9 1.3 本文章节安排 9-11 第二章 数据挖掘 11-23 2.1 数据挖掘概述 11-15 2.1.1 数据挖掘的定义 11 2.1.2 数据挖掘过程 11-14 2.1.3 数据挖掘的主要问题 14-15 2.2 数据挖掘的方法与分类 15-18 2.2.1 关联规则挖掘 15-16 2.2.2 分类与预测 16-18 2.2.3 聚类 18 2.3 数据挖掘的应用和发展趋势 18-20 2.3.1 数据挖掘的应用 19-20 2.3.2 数据挖掘的发展趋势 20 2.4 本章小结 20-23 第三章 关联规则挖掘理论与算法 23-37 3.1 关联规则基本概念 23-24 3.2 关联规则的主要研究方向 24-25 3.3 经典关联规则算法 25-34 3.3.1 典Apriori算法及改进 25-29 3.3.2 Close算法 29-32 3.3.3 FP-Growth算法及优缺点 32-34 3.4 基于时间划分的动态数据关联规则挖掘算法的提出 34-35 3.4.1 一般关联规则的缺点分析 34 3.4.2 动态数据关联规则算法的提出 34-35 3.5 本章小结 35-37 第四章 基于时间划分的动态数据关联规则算法 37-47 4.1 动态数据关联规则算法核心思想及体系结构 37-39 4.1.1 算法的核心思想及基本步骤 37-38 4.1.2 算法的体系结构 38-39 4.2 动态关联规则算法的相关概念 39-41 4.3 动态关联规则算法的实现 41-45 4.3.1 算法的描述 41-42 4.3.2 算法的特点 42-43 4.3.3 算法的伪代码实现 43-44 4.3.4 试验分析与比较 44-45 4.4 本章小结 45-47 第五章 系统的设计与实验分析 47-71 5.1 数据挖掘服务软件设计与实现 47-51 5.1.1 系统框架 47-48 5.1.2 功能模块 48-50 5.1.3 系统性能 50-51 5.2 系统详细设计 51-58 5.2.1 系统数据结构设计 52-56 5.2.2 系统接口与调度设计 56-57 5.2.3 系统数据设计规范设计 57-58 5.3 系统开发平台及界面 58-65 5.4 实验结果及分析 65-71 5.4.1 数据源的选择 65-67 5.4.2 挖掘流程分析 67 5.4.3 动态数据关联规则及评价 67-71 第六章 总结与前景展望 71-73 6.1 本文总结 71-72 6.2 前景展望 72-73 致谢 73-75 参考文献 75-79 在读期间发表论文 79
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 粗糙集的增量式属性约简研究,TP18
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|