学位论文 > 优秀研究生学位论文题录展示

时间序列的相似性查询与异常检测

作 者: 肖辉
导 师: 胡运发
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 时间序列 模式表示 相似性查询 空间存取方法 异常检测
分类号: TP311.11
类 型: 博士论文
年 份: 2005年
下 载: 1968次
引 用: 64次
阅 读: 论文下载
 

内容摘要


时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列,在经济、金融、科学观测和工程等各个领域都广泛存在。如何有效地管理和利用这些历史时间序列,发现这些数据背后隐含的规律和知识,是人们广泛关注的问题。与传统时间序列分析提出假设然后进行验证的数据处理方法不同,时间序列数据挖掘适合发现型任务,能够从大量历史数据中挖掘出潜在的、未知的、有价值的知识,已经吸引了越来越多的关注。 目前,时间序列数据挖掘主要包括相似性查询、序列挖掘、分类、聚类以及异常检测。论文主要研究了相似性查询与异常检测,包括时间序列的模式表示、相似性度量、索引和查询、异常定义和检测,主要的研究内容和研究成果简单介绍如下: (1) 时间序列的模式表示 由于时间序列数据的海量和复杂数据特点,直接在时间序列上进行数据挖掘不但在储存和计算上要花费高昂代价而且可能会影响算法的准确性和可靠性。时间序列的模式表示是一种对时间序列进行抽象和概括的特征表示方法,是在更高层次上对时间序列的重新描述。论文首次将边缘算子引入时间序列研究,提出了基于时态边缘算子的分段线性表示方法(简称为TEO表示)。TEO表示简单直观,具有数据压缩和除噪能力。在不同领域的时间序列数据集上的实验表明:与其它几种分段线性表示相比,TEO表示与原始时间序列之间的拟合误差更小,具有很强的适应性,能够应用于不同的数据特征环境。 (2) 时间序列的相似性度量 欧几里德距离和动态时间弯曲距离是时间序列数据挖掘中主要采用的两种相似性度量。但是欧几里德距离不支持时间序列的线性漂移和时间弯曲,动态时间弯曲距离则因为平方阶的时间复杂度无法得到广泛的应用。论文在时间序列的模式表示基础上,提出了动态模式匹配距离(简称为DPM距离),DPM距离支持时间序列的时间弯曲,时间复杂度随着模式长度的增长而接近线性。在仿真数据集和人脸图像识别数据集上的实验表明:采用DPM距离的Knn方法在分类准确

全文目录


目录  3-6
图表目录  6-8
摘要  8-10
ABSTRACT  10-13
第一章 绪论  13-24
  1.1 研究背景  13-15
  1.2 研究现状  15-21
    1.2.1 时间序列模式表示  15-17
      1.2.1.1 频域表示  16
      1.2.1.2 奇异值表示  16
      1.2.1.3 符号化表示  16-17
      1.2.1.4 分段线性表示  17
    1.2.2 时间序列的相似性度量  17-19
      1.2.2.1 欧几里德距离  17-18
      1.2.2.2 动态时间弯曲距离  18-19
      1.2.2.3 其它相似性度量  19
    1.2.3 时间序列的索引  19-20
    1.2.4 时间序列的异常检测  20-21
  1.3 本文工作  21-24
    1.3.1 研究内容和成果  21-23
    1.3.2 组织结构  23-24
第二章 时间序列的模式表示  24-44
  2.1 引言  24-25
  2.2 相关工作  25-33
    2.2.1 频域表示法  28-29
    2.2.2 奇异值表示  29-30
    2.2.3 符号化表示  30
    2.2.4 分段线性表示法  30-33
  2.3 基于时态边缘算子的模式表示  33-38
    2.3.1 边缘算子  33-34
    2.3.2 时间序列的TEO表示  34-37
    2.3.3 算法分析  37-38
  2.4 实验及结果分析  38-42
    2.4.1 实验数据  38-39
    2.4.2 实验方法  39-40
    2.4.3 实验结果及分析  40-42
  2.5 小结  42-44
第三章 时间序列的相似性度量  44-63
  3.1 引言  44-45
  3.2 相似性度量  45-54
    3.2.1 Minkowski距离  45-49
    3.2.2 动态时间弯曲距离  49-52
    3.2.3 最长公共子串  52-54
    3.2.4 其它距离  54
  3.3 动态模式匹配距离  54-57
  3.4 实验  57-61
    3.4.1 CMU Faces Image数据集  57-59
    3.4.2 Cylinder-Bell-Funnel(CBF)数据集  59-61
  3.5 小结  61-63
第四章 时间序列的相似性查询  63-82
  4.1 引言  63-65
  4.2 问题描述及相关研究  65-69
    4.2.1 相似性查询  65-66
    4.2.2 关键问题与相关研究  66-69
  4.3 OR-Tree结构及算法  69-75
    4.3.1 查询算法  72
    4.3.2 插入算法  72-73
    4.3.3 结点溢出算法  73-75
  4.4 时间序列的相似性查询  75-77
  4.5 实验及结果分析  77-81
    4.5.1 DPM_LB距离的过滤能力  77-79
    4.5.2 基于OR-Tree的相似性查询  79-81
  4.6 小结  81-82
第五章 时间序列的异常检测  82-97
  5.1 引言  82-84
  5.2 相关工作  84-86
  5.3 时间序列的模式异常定义  86-89
  5.4 时间序列的模式异常检测算法  89-90
  5.5 实验与分析  90-96
    5.5.1 Ma_Data数据集  90-92
    5.5.2 Keogh_Data数据集  92-93
    5.5.3 Santa Fe竞赛数据集  93-94
    5.5.3 股票数据集  94-96
  5.6 小结  96-97
第六章 总结与展望  97-100
  6.1 总结  97-98
  6.2 进一步工作  98-100
参考文献  100-111
攻读博士学位期间参与的科研项目及主要成果  111-112
  1.参与的科研课题  111
  2.发表与录用的论文  111-112
致谢  112-113

相似论文

  1. 基于核方法的高光谱图像异常检测算法研究,TP751
  2. 发育于热带地区玄武岩的时间序列土壤中石英和植硅体的变化特征,S153
  3. 人工免疫分类和异常识别算法的改进,R392.1
  4. 朝阳地区参考作物腾发量演变特征与预测模型研究,S161.4
  5. 基于混沌时间序列的桥梁变形预测分析,U441
  6. 中国区域降水时空变化模式分析,P426.614
  7. 交通视频中车辆异常行为检测及应用研究,TP391.41
  8. 基于相似性分析的时间序列异常检测研究,TP311.13
  9. 动力博弈系统及混沌理论在演化中的应用研究,O225
  10. 自相关过程残差控制图及模式分类方法研究,F274;F273.2
  11. 基于卡尔曼滤波器的自适应网络异常检测方法,TN915.08
  12. 基于混沌理论的话务量时间序列预测研究,TN915.09
  13. 基于滑窗小波二叉树的网络异常检测与分析,TP393.08
  14. 网络流量异常检测算法,TP393.06
  15. 基于网络异常流量的突发毁击事件检测技术研究与应用,TP393.06
  16. NetFlow数据处理与异常检测研究,TP393.08
  17. 基于递归神经网络与集成算法的时间序列预测应用研究,TP183
  18. 基于GIS的矿井采掘衔接决策支持系统设计,TD822
  19. 统计数据拟合预测及其在证券分析中的应用,F224
  20. 基于中原地区的经济增长模型及其机理分析,F127
  21. 时间序列模型的误差分析与研究,F830.91

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 程序设计方法
© 2012 www.xueweilunwen.com