学位论文 > 优秀研究生学位论文题录展示

时间序列部分周期模式挖掘研究

作 者: 席元鸿
导 师: 王治和
学 校: 西北师范大学
专 业: 计算机应用技术
关键词: 数据挖掘 时间序列 部分周期模式挖掘 概念格
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 62次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息技术的飞速发展,时间序列数据在我们的工作生活中广泛存在,如股票价格、水文数据、商品销售、气象数据等,同时它们呈现出爆炸式增长。针对这些海量历史时序数据,如何利用新的技术方法,将其转化为可靠的知识信息,提高人类对未来的预测能力以及对未来事件的提前控制能力,一直受到人们的密切关注。时间序列数据挖掘旨在从这些海量数据中找出对用户决策有价值的信息,现已成为数据挖掘中一个重要的研究方向。由于时间序列部分周期模式挖掘在应用中更为常见,更有研究价值和意义,成为时间序列数据挖掘的研究热点之一,因此,本文选择它作为主要研究对象。本文首先概述了时间序列数据挖掘及其研究现状,对现有的几种时间序列部分周期模式挖掘算法进行了详细的研究。目前,大部分时间序列部分周期模式挖掘算法都是在给定周期的前提下进行的,这样必将会使一些有潜在价值的周期模式不能被挖掘。针对这个缺陷,本文结合时间序列二进制编码,提出了基于权重的POS(时间序列中事件发生位置)求解算法,接着又推导了周期阈值公式,利用潜在周期发现算法找到时间序列中有意义的周期。其次,本文分析了最大子模式命中算法和层次链式图算法,相对于类Apriori算法,它们在部分周期模式挖掘的效率上有了明显改进,但仍需要对时间序列数据库扫描2次,并且它们都要进行模式频繁计数的统计等工作。针对此不足,本文创新性地将概念格引入到时间序列部分周期模式挖掘中,提出了基于概念格的时间序列部分周期模式挖掘算法,它不仅能够将对数据库的扫描次数降为1次,在概念格的Hasse图中可以直接读取模式频繁计数来确定频繁模式,而且还可以将增量算法和挖掘算法结合为一体。最后,通过仿真实验验证了基于概念格的部分周期模式挖掘算法的有效性。

全文目录


摘要  4-5
Abstract  5-8
第一章 绪论  8-13
  1.1 研究的背景和意义  8-9
  1.2 国内外研究现状  9-10
  1.3 本文研究内容和创新点  10-13
    1.3.1 研究内容  10-11
    1.3.2 主要创新点  11-13
第二章 时间序列数据挖掘概述  13-18
  2.1 时间序列基本知识  13
  2.2 时间序列数据挖掘功能  13-15
  2.3 时间序列周期模式挖掘  15-18
第三章 时间序列部分周期模式挖掘研究  18-31
  3.1 部分周期模式基本知识  18-19
  3.2 Apriori算法  19-20
    3.2.1 Apriori算法描述  19-20
    3.2.2 Apriori算法分析  20
  3.3 类Apriori算法  20-21
    3.3.1 类Apriori部分周期模式挖掘算法描述  20-21
    3.3.2 类Apriori部分周期模式挖掘算法分析  21
  3.4 最大子模式命中算法  21-27
    3.4.1 最大子模式命中算法基本概念  22-24
    3.4.2 最大子模式命中算法描述  24-26
    3.4.3 最大子模式命中算法性能分析  26-27
  3.5 基于层状链式图的部分周期模式挖掘算法  27-29
    3.5.1 层状链式图基本概念  27-28
    3.5.2 层状链式图算法描述  28-29
    3.5.3 层状链式图性能分析  29
  3.6 本章小结  29-31
第四章 基于概念格的时间序列部分周期模式挖掘  31-47
  4.1 概念格的基础知识  31-33
    4.1.1 概念格基本概念  31-32
    4.1.2 Hasse图基本概念  32-33
  4.2 数据预处理  33-38
    4.2.1 二进制编码的映射算法  33-34
    4.2.2 基于权重的POS求值算法  34-35
    4.2.3 周期阈值公式推算  35-37
    4.2.4 潜在周期发现算法  37-38
  4.3 基于概念格的时间序列部分周期模式挖掘  38-46
    4.3.1 概念格构建算法简介  38-39
    4.3.2 增量式概念格构建算法  39-45
    4.3.3 基于概念格部分周期模式挖掘算法  45-46
    4.3.4 基于概念格部分周期模式挖掘算法分析  46
  4.4 本章小结  46-47
第五章 实验及性能分析  47-51
  5.1 实验数据准备  47-48
    5.1.1 实验数据  47-48
    5.1.2 开发环境  48
  5.2 实验结果及分析  48-49
    5.2.1 实验结果  48-49
    5.2.2 结果分析  49
  5.3 本章小结  49-51
第六章 总结与展望  51-53
  6.1 全文总结  51
  6.2 不足与展望  51-53
参考文献  53-57
致谢  57-58
攻读硕士期间发表论文  58
攻读硕士期间参与科研项目  58

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. 发育于热带地区玄武岩的时间序列土壤中石英和植硅体的变化特征,S153
  5. Bicluster数据分析软件设计与实现,TP311.52
  6. 基于变异粒子群的聚类算法研究,TP18
  7. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  8. 基于遗传算法和粗糙集的聚类算法研究,TP18
  9. 朝阳地区参考作物腾发量演变特征与预测模型研究,S161.4
  10. 基于数据挖掘的税务稽查选案研究,F812.42
  11. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  12. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  13. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  14. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  15. 教学质量评估数据挖掘系统设计与开发,TP311.13
  16. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  17. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  18. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  19. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  20. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  21. 高校毕业生就业状况监测系统研究,G647.38

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com