学位论文 > 优秀研究生学位论文题录展示

基于DF2Ls的序列模式挖掘研究

作 者: 王永强
导 师: 马志新
学 校: 兰州大学
专 业: 计算机软件与理论
关键词: 数据挖掘 序列模式挖掘 剪枝策略 DSEP DIEP SPAM+
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 7次
引 用: 0次
阅 读: 论文下载
 

内容摘要


序列模式挖掘(sequence pattern mining)是指挖掘相对时间内比其他序列出现频率高的序列模式,已在实际生产、生活中广泛应用;它是对关联规则挖掘的进一步推广应用,是数据挖掘的一个重要研究方向。序列模式挖掘算法可分为两类:基于Apriori的侯选代码生成—测试方法及基于模式增长的方法。但是,传统计算方法均有一定的技术缺陷和不足,Apriori类计算方法与频繁模式增长算法都可能会产生庞大的候选集,并造成挖掘系统开销过大。基于此,我们在研究以上两种算法的基础上,推出了两种新的剪枝策略:DSEP(动态顺序延伸修剪)和DIEP(动态项目延期修剪)。以期在频繁序列模式挖掘时通过合理的剪枝方法来提升Apriori类算法执行效率。本文所提出的这两种剪枝方法(DSEP、DIEP)可用于所有的Apriori-like序列开发算法或lattice-theoretic途径,利用改进策略和修剪的算法来优化SPAM算法并推出了目前的改进算法:SPAM+,其核心是运用DSEP和DIEP来删除SPAM算法的搜索空间,使其共用2-sequences动态频率列表(DF2Ls)。最后,通过多次实验,综合分析结果表明,SPAM+’性能优于SPAM。

全文目录


中文摘要  3-4
Abstract  4-7
第一章 引言  7-12
  1.1 研究背景及意义  7-8
  1.2 发展和研究现状  8-9
  1.3 本文的结构和创新点  9-11
    1.3.1 本文的组织结构  10
    1.3.2 本文的主要工作  10-11
  1.4 小结  11-12
第二章 数据挖掘及关联规则挖掘概论  12-21
  2.1 数据挖掘概论  12-15
    2.1.1 数据挖掘的概念  12-13
    2.1.2 数据挖掘的主要研究内容及方法  13-15
  2.2 关联规则挖掘的概论  15-20
    2.2.1 关联规则挖掘的概念  15-16
    2.2.2 关联规则挖掘的种类  16-19
    2.2.3 关联规则挖掘的经典算法  19-20
  2.3 小结  20-21
第三章 序列模式挖掘概念与典型算法  21-29
  3.1 序列模式挖掘的概念及定义  21-22
  3.2 序列模式挖掘种类  22-26
    3.2.1 基于Apriori的侯选代码生成—测试算法  22-23
    3.2.2 模式增长算法  23-24
    3.2.3 序列模式增量挖掘  24-26
  3.3 基于Apriori序列模式挖掘算法  26-27
    3.3.1 AprioriAll算法  26
    3.3.2 GSP算法的描述与分析  26-27
    3.3.3 序列模式挖掘其他研究方向  27
  3.4 小结  27-29
第四章 基于DF2Ls的序列模式挖掘研究  29-36
  4.1 相关挖掘算法及剪枝策略的研究  29
  4.2 SPAM算法  29-30
  4.3 本文提出的剪枝策略  30-35
    4.3.1 词典序列树  30-31
    4.3.2 扩展的候选集  31
    4.3.3 SEP策略和IEP策略  31-32
    4.3.4 本文提出的剪枝策略和剪枝算法  32-34
    4.3.5 SPAM+:应用DSEP和DIEP优化SPAM算法  34-35
    4.3.6 共享S列表和I列表  35
  4.4 小结  35-36
第五章 实验与分析  36-40
  5.1 试验环境  36
  5.2 试验结果  36-37
  5.3 试验分析  37-38
  5.4 小结  38-40
第六章 结论及进一步工作  40-41
  6.1 主要结论  40
  6.2 研究展望  40-41
参考文献  41-44
在校期间的研究成果  44-45
致谢  45

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  10. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  11. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  12. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  13. 教学质量评估数据挖掘系统设计与开发,TP311.13
  14. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  15. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  16. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  17. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  18. 基于兴趣度的Web日志用户访问序列模式挖掘,TP311.13
  19. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  20. 高校毕业生就业状况监测系统研究,G647.38
  21. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com