学位论文 > 优秀研究生学位论文题录展示

基于LB_Hust距离的时间序列数据聚类

作 者: 崔美玲
导 师: 刘江
学 校: 天津大学
专 业: 计算机应用技术
关键词: 时间序列数据 DTW算法 LB_Hust距离 层次聚类
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 32次
引 用: 0次
阅 读: 论文下载
 

内容摘要


时间序列数据分布广泛,长期以来,不同领域时间序列数据大量积累,对时间序列的数据挖掘逐渐得到关注。本文以公共的股票数据组成的时间序列数据作为研究对象,将时间序列数据的聚类作为研究目的,通过在股票数据上进行聚类,对时间序列趋势相似度的表征进一步分析和研究。本文针对时间序列数据基于趋势相似性的聚类,以原始LB_Hust距离作为时间序列相似度计算方法基础,对改原始距离计算方法进行正负分割,使其适用于时间序列趋势的相似度区分。在改进的相似度计算方法上,实现层次聚类算法,通过改进,对实现中的时间复杂度进行降低。最后,将时间序列数据聚类应用于股票数据,实现对不同股票进行基于趋势相似的聚类,通过股票的聚类分析控股公司运作上的相似性,对长期投资者提供参考。实验证明,改进的LB_Hust距离计算方式能够较好的度量时间序列的趋势相似性,扩展了原始LB_Hust距离计算方式的应用范围。

全文目录


摘要  3-4
ABSTRACT  4-7
第一章 绪论  7-11
  1.1 时间序列数据挖掘综述  7-8
    1.1.1 时间序列数据概念  7
    1.1.2 时间序列数据挖掘任务  7-8
  1.2 时间序列数据聚类的背景和意义  8-9
  1.3 研究内容  9-10
  1.4 文章结构  10-11
第二章 时间序列聚类基础  11-19
  2.1 聚类分析  11-13
    2.1.1 聚类算法研究现状  11-12
    2.1.2 聚类算法步骤  12-13
  2.2 时间序列数据的聚类  13-19
    2.2.1 时间序列数据的定义和特点  13-14
    2.2.2 时间序列的相似性度量  14-16
    2.2.3 时间序列距离计算  16-17
    2.2.4 时间序列聚类算法  17-19
第三章 基于LB_Hust距离的时间序列聚类设计  19-48
  3.1 时间序列的表示  19-22
  3.2 时间序列距离计算  22-29
  3.3 LB_Hust距离下的相似性比较  29-36
    3.3.1 DTW定义  29-31
    3.3.2 DTW特点和复杂度分析  31-32
    3.3.3 基于DTW思想的距离计算方法  32-34
    3.3.4 LB_Hust距离计算方法  34-36
  3.4 基于LB_Hust距离的层次聚类  36-48
    3.4.1 算法流程  36-38
    3.4.2 基于LB_Hust距离矩阵的层次聚类  38-39
    3.4.3 算法性能分析和改进  39-42
    3.4.4 算法效果分析和改进  42-48
第四章 股票时间序列数据聚类  48-60
  4.1 任务描述  48-49
  4.2 数据准备  49-51
    4.2.1 股票数据空值的处理  49-50
    4.2.2 股票数据的归一化  50-51
  4.3 股票数据聚类  51-55
  4.4 效果分析和评估  55-60
    4.4.1 LB_Hust两种距离下的效果分析  55-58
    4.4.2 最大允许簇数的选择  58-60
第五章 总结和展望  60-61
参考文献  61-64
发表论文和参加科研情况说明  64-65
致谢  65

相似论文

  1. 对于系统发育谱法聚类算法的改进,TP311.13
  2. 基于GPU的时间序列并行检索算法研究,TP391.41
  3. 统计数据拟合预测及其在证券分析中的应用,F224
  4. 基于卷积算法的时间序列部分周期模式挖掘算法研究,TP311.13
  5. 基于过程神经元网络的时间序列数据挖掘模型及其应用,TP311.13
  6. 多时间序列上挖掘框架的研究,TP311.13
  7. 时间序列数据流中相关性分析技术的研究,TP311.13
  8. 基于协调发展的城乡人口迁移计量模型研究,F224
  9. 面向分子生物系统的计算技术应用研究,Q7-3
  10. 人工神经网络在金融时间序列数据预测中的应用研究,TP183
  11. 基于小波方法的金融时间序列分析,F830
  12. 进化神经网络及其在企业订单预测中的应用研究,F272
  13. 基于动态链表结构的时间序列异步周期模式挖掘研究,TP311.13
  14. 基于气象数据的数据挖掘算法研究,P409
  15. 基于数据挖掘的时间序列预测的研究与应用,TP311.13
  16. 基于内容的音乐检索关键技术研究,TP391.3
  17. 时间序列部分周期模式挖掘算法研究,TP311.13
  18. 实验时间点的选取对基因调控网络构建的影响,Q78
  19. 基于互信息网络模型的冰雹回波时间序列知识发现,TP399-C3
  20. 面向瓦斯监测数据的时间序列相似搜索算法研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com