学位论文 > 优秀研究生学位论文题录展示

关联规则挖掘的算法研究

作 者: 朱红蕾
导 师: 李明
学 校: 兰州理工大学
专 业: 控制理论与控制工程
关键词: 数据挖掘 关联规则 频繁项集 增量算法 概念格
分类号: TP311.13
类 型: 硕士论文
年 份: 2004年
下 载: 235次
引 用: 1次
阅 读: 论文下载
 

内容摘要


知识就是力量。随着当前IT技术、电子商务及互联网的快速发展和迅速普及,导致在各个应用领域的数据库中存储了大量的数据,这些数据集中包含了很多有用的知识,因此如何发现各种大型数据库中所隐藏的、预先未知的信息以辅助相应的应用显得尤为重要,这正是数据挖掘(Data Mining)所要完成的任务。数据挖掘技术是在应用需求的推动下,由人工智能技术、数据库技术、统计学和数据仓库技术等多种学科融合的结果,是从大量的数据库中识别出有效的、新颖的、潜在的有用的,以及最终可理解的知识和模式的高级过程。可以说,有数据积累的地方,就有数据挖掘技术的用武之地。近年来国内外学者提出了一系列的数据挖掘理论,世界上主要的IT公司,如IBM、Oracle及Microsoft等也已经相继推出了各自的数据挖掘产品。关联规则(Association Rules)作为数据挖掘领域的一个重要研究分支,其主要的研究目的是从大型数据集中发现隐藏的、有趣的、属性间存在的有趣的关联或相关关系。由于形式简单、易于理解,且是从大型数据库中提取知识的主要手段,因此关联规则挖掘的研究与应用已经得到了数据库、人工智能及统计学等领域的学者的广大关注,并取得了不少的研究成果。与人工智能中的神经网络、遗传算法及统计学不同的是,关联规则挖掘处理的数据对象通常相对较小,且人工智能的方法重在寻找输入输出间的模型,而关联规则的挖掘则是用于发现数据集合中所包含的属性间的规律,其结果不是一个具体的模型而是数量众多的规则。此外,统计学中的方法尽管处理的对象也可以是大量的数据,然而其主要的作用是用于确定数据的统计分布或统计模型,而不能描述数据集中所包含的数据间的规律。关联规则挖掘自1993年R.Agrawal等人提出后已被数据库界广泛研究,其算法也在原有算法的基础上不断优化,使关联规则挖掘的效率不断提高。但是仍然存在许多使用这些算法不能解决的问题:当挖掘的数据不断更新时,如何高效即时的获得所需的结果:用户要试探性地预先设定一些固定的挖掘参数,如果参数设置不适当,可能需要很长的响应时间,并且会产生大量的无用规则等。因此,不仅需要设计高效的算法来挖掘关联规则,而且也迫切需要设计高效的算法来更新、维护和管理已挖掘出来的关联规则。本文提出了一种高效的增量更新算法-IFUP算法,该算法是在IUWP算法的框架上进行了改进。通过实例进行分析比较,证明了该算法有效的提高了挖掘的效率。另外,现在也有很多研究员提出了利用概念格来挖掘关联规则,本文也对这种方法进行了初步的研究与探讨。

全文目录


第一章 引言  6-9
  1.1 数据挖掘关联规则挖掘的研究  6
  1.2 国内外研究现状及存在的问题  6-8
    1.2.1 数据挖掘的现状及存在的问题  6-7
    1.2.2 关联规则挖掘的现状及存在的问题  7-8
  1.3 论文的结构  8-9
第二章 数据挖掘  9-20
  2.1 数据挖掘的基本概念  9-13
    2.1.1 知识发现的概念  9-10
    2.1.2 数据挖掘的概念  10-12
    2.1.3 数据挖掘的本质  12-13
  2.2 数据挖掘的分类  13-14
    2.2.1 根据知识类型分类  13
    2.2.2 根据挖掘的任务、对象和方法分类  13-14
  2.3 数据挖掘的工具及应用  14-16
    2.3.1 数据挖掘工具的分类  14-15
    2.3.2 数据挖掘的应用  15-16
  2.4 数据挖掘的研究现状及主要问题  16-17
    2.4.1 研究现状  16-17
    2.4.2 数据挖掘的主要问题  17
  2.5 数据挖掘的发展趋势  17-20
第三章 关联规则挖掘  20-36
  3.1 关联规则挖掘的基本概念  20
  3.2 关联规则挖掘的算法  20-23
    3.2.1 经典Apriori算法  21
    3.2.2 基于Apriori优化和改进的算法  21-22
    3.2.3 多层和多维关联规则挖掘算法  22-23
  3.3 在线关联规则挖掘算法  23-26
    3.3.1 在线关联规则挖掘算法  23-24
    3.3.2 在线产生频繁项集  24-25
    3.3.3 在线产生关联规则  25-26
  3.4 关联规则的维护算法  26-30
    3.4.1 维护算法的概念  26-27
    3.4.2 维护算法的分类  27-30
  3.5 一种改进的高效维护算法  30-36
    3.5.1 相关定义和定理  30
    3.5.2 FUP算法和UWEP算法的不足  30-31
    3.5.3 IFUP算法  31-33
    3.5.4 实例分析  33-36
第四章 概念格  36-42
  4.1 概念格的基本概念  36-37
  4.2 概念格的建造  37-39
    4.2.1 批处理算法  38-39
    4.2.2 增量算法  39
  4.3 概念格的简化  39-40
  4.4 规则提取及相关系统  40
  4.5 应用  40-42
结论  42-44
参考文献  44-46
致谢  46
攻读研究生期间所发表的论文  46

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  10. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  11. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  12. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  13. 教学质量评估数据挖掘系统设计与开发,TP311.13
  14. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  15. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  16. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  17. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  18. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  19. 高校毕业生就业状况监测系统研究,G647.38
  20. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  21. 基于关联规则的结构化浏览技术及其应用,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com