学位论文 > 优秀研究生学位论文题录展示
基于矩阵的加权关联规则挖掘算法研究
作 者: 刘海蓉
导 师: 闫仁武
学 校: 江苏科技大学
专 业: 计算机应用技术
关键词: 数据挖掘 Apriori算法 加权关联规则 频繁项集 矩阵
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 71次
引 用: 0次
阅 读: 论文下载
内容摘要
自20世纪60年代以来,数据库技术开始被广泛地应用于国家政府机构、商业部门和科研机构等领域。随着时代的发展,特别是互联网技术的出现,这些领域的数据库的数据呈现近乎几何爆炸式的增长,因此对海量数据集进行信息提取的需求就变得日益迫切。传统的数据库技术的局限性在于只能针对数据库进行查询和检索,而不能从数据库中提取知识,造成数据库中所蕴含的丰富知识不能被有效地发掘和利用,在这样的背景下就诞生了数据挖掘技术。数据挖掘被期望用来从历史积累的大量数据中挖掘出隐藏的规律或关联,从而为决策的制定和执行提供有力的参考和帮助。作为数据挖掘主要研究的方向之一的关联规则挖掘(Association Rule Mining) ,其主要是用于从数据库中找出数据项之间的关联关系,作为决策参考的依据。迄今为止,最有影响的布尔型挖掘关联规则算法是R. Agrawal等人提出的Apriori算法。但是基于经典Apriori算法的关联规则算法存在两个问题,需要多次扫描数据库和容易忽略出现频率小但是价值高的项目。Apriori算法在处理数据库中的各个项目时,是假设数据库中的每个项目具有相同的重要性,但是这样显然不符合实际情况。为了更合理地进行数据挖掘,人们引入了权重的概念使得挖掘的数据和潜在的模式更具有现实意义,因此需要利用现有的知识,对加权关联规则的研究进行认真细致的研究。本文对传统加权关联规则挖掘算法进行了改进,该改进算法采用矩阵和加权关联规则算法相结合的方法,并做了改进算法与传统加权关联规则挖掘算法的性能对比实验,得到的实验结果表明本文提出的改进算法在性能上优于原有加权关联规则挖掘算法。该改进算法的创新之处在于引入了矩阵思想,只需要扫描一次数据库来构建矩阵,给出了改进的权值定义,该定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据,解决了传统加权关联规则挖掘算法中加权频繁项集不存在普通关联规则中频繁项集所具有的反单调性的问题。
|
全文目录
摘要 2-3 Abstract 3-9 第1章 绪论 9-14 1.1 研究背景 9 1.2 国内外研究现状 9-11 1.2.1 国外研究现状 10-11 1.2.2 国内研究现状 11 1.3 论文研究的目的和意义 11-12 1.4 论文研究的内容 12 1.5 论文的组织结构 12-14 第2章 数据挖掘 14-25 2.1 数据挖掘概念及相关定义 14-18 2.1.1 数据挖掘概述 14 2.1.2 数据挖掘定义 14-17 2.1.3 数据挖掘的对象 17 2.1.4 数据挖掘的功能 17-18 2.2 数据挖掘的技术 18-20 2.3 数据挖掘的应用 20-22 2.4 数据挖掘面临的问题和前景展望 22-24 2.4.1 数据挖掘面临的问题 22-23 2.4.2 数据挖掘的前景展望 23-24 2.5 本章小结 24-25 第3章 关联规则挖掘算法 25-36 3.1 关联规则的基本概念 25-27 3.1.1 关联规则的定义 25-26 3.1.2 关联规则挖掘的性质 26-27 3.2 关联规则挖掘种类 27-28 3.3 关联规则算法分类 28-29 3.4 经典Apriori 算法 29-35 3.4.1 Apriori 算法性质 30 3.4.2 Apriori 算法的基本思想 30 3.4.3 Apriori 算法描述 30-31 3.4.4 Apriori 算法实例 31-34 3.4.5 Apriori 算法优化 34-35 3.5 本章小结 35-36 第4章 算法改进 36-47 4.1 加权关联规则的简介 36-38 4.2 加权关联规则挖掘算法研究 38-39 4.2.1 加权关联规则挖掘的定义 38 4.2.2 加权关联规则挖掘算法的不足 38-39 4.3 基于矩阵的加权关联规则挖掘算法 39-46 4.3.1 算法的定义 40-41 4.3.2 算法描述 41-43 4.3.3 算法实例 43-46 4.4 算法分析 46 4.5 本章小结 46-47 第5章 实验 47-51 5.1 实验环境 47 5.2 实验设计 47 5.3 实验结果 47-50 5.4 本章小结 50-51 结论 51-53 参考文献 53-56 攻读硕士学位期间发表的学术论文目录 56-57 致谢 57-58 大摘要 58-62
|
相似论文
- 无尾飞翼式飞行器主动控制的参数化方法,V249.1
- LDPC码译码算法的研究,TN911.22
- 离散切换系统稳定性分析及控制器设计,TP13
- 网络化系统的鲁棒模型预测控制,TP273
- 车载FlexRay主干网的构建与性能分析,TP273
- 随机时滞系统的稳定性分析与鲁棒控制器设计,TP13
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 七维稳定耗散系统的代数条件及动力学性质,O175
- 蒸汽管路系统结构振动研究,TK284.1
- 广义系统的结构分析及控制方法研究,N945.1
- 含左手材料平板波导的电磁特性,O441.6
- Bicluster数据分析软件设计与实现,TP311.52
- 蚁群算法及其在气象卫星云图分割中的应用,TP391.41
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 系统控制理论及其在水下机器人系统中的应用研究,TP13
- 三丁基锡对海洋腹足类种群的生态风险评价,X174
- 基于数据挖掘的税务稽查选案研究,F812.42
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|