学位论文 > 优秀研究生学位论文题录展示

OLAP中数据立方体增量计算方法的研究

作 者: 彭兵
导 师: 李仁发; 段登高
学 校: 湖南大学
专 业: 计算机技术
关键词: 数据立方体 聚集计算 压缩 增量更新
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 2次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据立方体是数据仓库和OLAP中的核心。当数据仓库中的数据实时更新时,对应的数据立方体也必须随之更新,否则OLAP查询得到的将是过时的数据。数据立方体更新多数采用增量维护,即依据基本表的改变量刷新已有的数据立方体。如何降低数据立方体占用的磁盘空间和提高数据立方体的计算速度成为了一个热点问题。在这样的背景下,本文开展了OLAP中数据立方体增量更新算法的研究,主要工作如下:1.本文首先介绍了OLAP基础知识、数据立方体的定义以及计算和查询,接着介绍了几种经典的数据立方体结构并且对各种立方体的优缺点进行了分析。然后介绍立方体聚集计算相关知识,重点剖析典型聚集计算算法Pipesort算法、Pipehash算法、多路数组聚集算法和BUC算法等,同时给出了聚集计算的优化方法。2.重点研究了可扩展多维数组作为数据立方体的数据组织模型,并通过去除完全冗余的逻辑压缩方法和基于HOEA的物理压缩方法对可扩展多维数组进行两次有效压缩,大幅度降低了数据立方体的空间复杂度。提出了EMA-Cube(Extendible Multidimensional Array Data Cube)扩展多维数组数据立方体模型。通过实例验证该模型消除了完全冗余数据单元,有效的压缩存储数据。3.分析数据立方体更新有两种实现策略,即增量更新和重新计算。研究了EMA-Cube的数据立方体增量更新计算方法,采用共享维信息辅助表(包括历史值表,首地址表和系数向量表)完成立方体的更新,有效缩短了数据立方体的计算时间和更新维护时间。

全文目录


摘要  5-6
Abstract  6-11
第1章 绪论  11-16
  1.1 研究的背景和意义  11-12
  1.2 数据立方体技术国内外研究现状  12-14
  1.3 本课题研究的任务和创新点  14-15
    1.3.1 本文的主要工作  14
    1.3.2 本文的主要创新点  14-15
  1.4 本论文的结构安排  15-16
第2章 联机分析处理和数据立方体  16-26
  2.1 联机分析处理  16-17
  2.2 数据立方体的基本概念  17-19
  2.3 数据立方体的计算  19-20
  2.4 数据立方体查询  20-22
    2.4.1 点查询  20-21
    2.4.2 范围查询  21
    2.4.3 冰山查询  21-22
    2.4.4 top-k查询  22
  2.5 经典立方体  22-25
    2.5.1 冰山立方体  22
    2.5.2 浓缩立方体  22-23
    2.5.3 侏儒立方体  23-24
    2.5.4 商立方体  24-25
  2.6 本章小结  25-26
第3章 立方体聚集算法研究  26-32
  3.1 常见立方体聚集算法  26-30
    3.1.1 Pipesort和Pipehash算法  26-28
    3.1.2 多路数组聚集算法(Multiway)  28-29
    3.1.3 BUC算法  29-30
  3.2 聚集计算的优化方法  30-31
  3.3 本章小结  31-32
第4章 数据立方体增量计算方法研究  32-50
  4.1 可扩展多维数组模型  33-35
    4.1.1 可扩展多维数组的逻辑模型  33-35
    4.1.2 可扩展多维数组的数据立方体  35
  4.2 基于HOEA的物理存储模型  35-38
    4.2.1 HOEA存储模型  35-36
    4.2.2 HOEA基本操作  36-38
  4.3 EMA-Cube模型  38-40
  4.4 EMA-Cube的增量计算方法  40-45
    4.4.1 立方体计算阶段  40-42
    4.4.2 立方体刷新阶段  42-45
  4.5 实验结果与分析  45-49
    4.5.1 实验环境  45
    4.5.2 实验数据  45-46
    4.5.3 EMA-Cube的压缩分析  46-47
    4.5.4 EMA-Cube的计算性能分析  47-48
    4.5.5 EMA-Cube的计算耗时分析  48-49
  4.6 本章小结  49-50
结论  50-51
参考文献  51-55
致谢  55

相似论文

  1. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  2. 基于率失真优化的码率控制算法研究,TN919.81
  3. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  4. 海量数据压缩、操作和处理方法的研究,TP311.13
  5. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
  6. 图像的稀疏表示及编码模型研究,TP391.41
  7. 基于感兴趣信息的高光谱图像压缩技术研究,TP391.41
  8. 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
  9. 高保真遥感图象压缩与分辨率增强联合处理研究,TP751
  10. MATLAB对雷达信号处理机系统后置处理的仿真应用,TN957.51
  11. 气—水可压缩流物质界面的R-M不稳定性研究,O359.1
  12. 远程医疗系统图像压缩及传输关键技术研究,R318.0
  13. 水下目标特征的压缩与融合技术研究,TN911.7
  14. 戴维·哈维空间转移理论及其哲学意义探析,B089.1
  15. 偏远地区配电变压器防盗监控系统的设计,TM421
  16. 基于单片视频压缩芯片的MPEG2编码器设计与实现,TN919.81
  17. 高阶中立型泛函微分方程非振动解的存在性及其迭代逼近,O175
  18. 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
  19. 基于小波的雷达视频压缩方法研究,TN957.52
  20. 1.342μm近光纤通信波段非经典光场的产生,O431.2
  21. 椎体强化术后夹心椎骨折的临床随访研究,R687.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com