学位论文 > 优秀研究生学位论文题录展示

基于关联规则的数据挖掘算法研究

作 者: 孙迪
导 师: 张凤荔
学 校: 电子科技大学
专 业: 软件工程
关键词: 数据挖掘 粒计算 数据仓库 权值
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 279次
引 用: 3次
阅 读: 论文下载
 

内容摘要


随着日益更新的信息技术特别基于网络的技术的飞速发展,人们对于数据的处理要求越来越高,因此,收集、存贮、传输数据的能力不断提高,然而与此背道而驰的是,对决策有价值的知识或信息却非常匮乏。面对着浩瀚无垠的信息海洋,人们呼唤着一个去粗取精、去伪存真的能将浩如烟海的数据转换成知识的技术,数据挖掘就是在这个背景下产生的。数据挖掘究其本质,其实就是从不完整的、海量的、模糊的、有噪声的、随机的实际应用数据中,提取出隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。关于数据挖掘的算法由很多,其中最主要也是最基础的方法就是基于关联规则的挖掘算法。因此本文讨论的主要内容就是基于对传统的关联规则挖掘算法做改进的基础上提出的新观点以及新方法。其中主要包括以下几部分:1、介绍了数据挖掘技术的兴起以及其在国内外的研究发展状况。2、着重介绍了关联规则挖掘的主要理论基础,首先引入了最为基础的Apriori算法,然后根据现实世界中数据项目重要性的不同而引入了权值的概念,又根据分布式网络飞速发展的现状提出了并行的概念,并由二者结合提出加权关联规则的并行挖掘算法,此算法在Apriori的基础上做了重大改进,并且提高了算法的效率。3、引入了粒计算的概念,并结合粒计算、完全图以及关联规则算法提出了一个新的挖掘算法,并通过实例进行了验证。4、通过结合数据挖掘、数据仓库、粒计算等相关知识对小型超市管理系统进行了详细的分析,其中通过本篇论文所介绍的改进算法GRC_G算法和加权关联规则算法对小型超市中数据的关联性进行了详细的分析,并通过与传统Apriori算法的比较,对新算法的性能进行了验证。

全文目录


摘要  4-5
ABSTRACT  5-9
第一章 绪论  9-14
  1.1 引言  9-10
  1.2 数据挖掘技术的兴起  10-11
    1.2.1 数据挖掘逐渐演变的过程  10-11
    1.2.2 国内现状  11
    1.2.3 国外现状  11
  1.3 本文的工作  11-12
  1.4 本文的结构  12-14
第二章 数据挖掘的理论基础  14-38
  2.1 数据挖掘的主要问题  14-28
    2.1.1 数据挖掘和KDD 的基本概念  14-15
    2.1.2 数据挖掘技术的模型  15-18
    2.1.3 数据挖掘技术的分类  18-19
    2.1.4 数据挖掘任务与知识类型  19-23
    2.1.5 数据挖掘的过程  23-24
    2.1.6 数据挖掘的对象  24
    2.1.7 数据挖掘采用的方法  24-26
    2.1.8 数据挖掘的应用  26-27
    2.1.9 面临的挑战  27-28
  2.2 关联规则挖掘基础  28-31
    2.2.1 关联规则的问题定义  28-29
    2.2.2 关联规则的种类  29-30
    2.2.3 关联规则的挖掘方法  30-31
    2.2.4 关联规则的发展方向  31
  2.3 关联规则的应用领域  31-32
  2.4 数据仓库及其管理  32-37
    2.4.1 数据仓库的定义与特征  33
    2.4.2 数据仓库的体系结构  33-35
    2.4.3 数据仓库逻辑模型设计  35
    2.4.4 数据仓库与数据挖掘的关系  35-37
  2.5 本章小结  37-38
第三章 关联规则挖掘算法的改进  38-50
  3.1 频繁模式关联规则挖掘  38-44
    3.1.1 Apriori 经典算法  38-43
    3.1.2 对Apriori 算法的改进  43-44
  3.2 一种高效的加权关联规则算法  44-49
    3.2.1 加权关联规则  44-46
    3.2.2 加权关联规则的并行挖掘算法  46-49
  3.3 本章小结  49-50
第四章 粒计算理论与应用  50-56
  4.1 引言  50
  4.2 粒计算理论与应用发展现状  50
  4.3 粒计算的主要模型、特点和相互关系  50-52
    4.3.1 商空间模型  50-51
    4.3.2 词计算模型  51-52
    4.3.3 粗糙集模型  52
  4.4 粒表示以及在关联规则中的应用  52-53
    4.4.1 粒计算  52-53
    4.4.2 粒子空间及粒计算在关联规则中的应用  53
  4.5 商空间理论、性质及原理  53-55
    4.5.1 商空间簇的性质  53-54
    4.5.2 商空间理论中推理的主要原理  54-55
  4.6 本章小结  55-56
第五章 基于粒计算的关联规则挖掘算法设计思想  56-64
  5.1 基于粒计算与完全图的关联规则挖掘算法设计思想  56-60
    5.1.1 完全图的概念  56
    5.1.2 算法中的定义和性质  56-58
    5.1.3 算法思想  58-60
  5.2 基于粒计算与完全图的关联规则挖掘算法具体描述  60-61
  5.3 基于粒计算的关联规则挖掘算法实例验证  61-63
  5.4 本章小结  63-64
第六章 基于数据挖掘的超市管理系统  64-89
  6.1 基于数据挖掘的超市管理系统模型  64-65
  6.2 小型超市数据仓库模型设计  65-79
    6.2.1 小型超市管理系统功能设计  65-71
    6.2.2 小型超市数据仓库实现方法  71-79
  6.3 商品销售关联分析  79-84
    6.3.1 原始数据采集  79-80
    6.3.2 数据预处理  80-81
    6.3.3 商品销售关联分析  81-82
    6.3.4 GRC_G 算法与其他算法的性能比较  82-84
  6.4 加权关联规则算法在小型超市中的运用  84-88
    6.4.1 商品销售关联分析  84-87
    6.4.2 性能测试  87-88
  6.5 本章小结  88-89
第七章 结论与展望  89-91
  7.1 结论  89-90
  7.2 进一步的工作  90-91
致谢  91-92
参考文献  92-94

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  10. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  11. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  12. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  13. 教学质量评估数据挖掘系统设计与开发,TP311.13
  14. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  15. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  16. 基于样图的纹理合成算法研究,TP391.41
  17. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  18. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  19. 家校互动教育平台中数据仓库的研究与应用,TP311.13
  20. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  21. 高校毕业生就业状况监测系统研究,G647.38

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com