学位论文 > 优秀研究生学位论文题录展示

数据仓库中物化视图的选择与调整

作 者: 王金水
导 师: 张东站
学 校: 厦门大学
专 业: 计算机软件与理论
关键词: 数据仓库 物化视图 静态选择 动态调整
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 55次
引 用: 1次
阅 读: 论文下载
 

内容摘要


数据仓库是一个面向主题的、集成的数据集合,用来支持管理人员的决策。它维护着海量的数据并且支持形式复杂的查询,如何高效的管理如此之多的数据并提供高效的查询是数据仓库面临的其中一个难题,而物化视图是解决这个问题的重要手段,但是它需要额外的系统空间来存储,并且需要牺牲系统的代价来维护,因此,物化视图的选择是一个重要的研究课题。传统物化视图的静态选择算法是基于查询分布概率已经由用户提供,或这些查询在综合数据上是均匀分布的前提下。但实际应用中,用户查询均匀分布或用户提供查询概率的假设常常不能成立,因此提出一种既有静态选择能力,又有动态调整能力的视图选择算法就显得相当有实际与研究意义。本文从静态和动态两方面深入研究物化视图的选择问题,基于SPJ(Select-project-join)视图假设的数据仓库模型,以MVPP为搜索空间,综合考虑存储空间、视图维护及查询性能,提出了一种新的物化视图选择和调整算法--VSAA(Views Selection and Adjustment Algorithm)。从数学模型和关键参数两个方面研究了VSAA的理论模型,针对VSAA实时性差的缺陷提出了DVMV(DynamicVirtual Materialized Views)算法作为VSAA算法的补充,以理论分析为指导实现了VSAA的算法并和各种经典算法进行了对比分析,利用TPC-H基准数据生成1G数据,并导入到Oracle数据库中作为实验数据,通过理论及实验证明了VSAA算法的有效性和优越性。

全文目录


摘要  4-5
Abstract  5-10
第一章 绪论  10-26
  1.1 引言  10
  1.2 联机分析处理概述  10-14
    1.2.1 OLAP的功能特征  12
    1.2.2 OLAP的实现  12-14
  1.3 物化视图概述  14-20
    1.3.1 物化视图的概念  14-15
    1.3.2 物化视图的主要管理任务  15-20
  1.4 国内外研究现状  20-22
    1.4.1 物化视图静态选择算法  20-22
    1.4.2 物化视图的动态调整  22
  1.5 存在的问题  22-24
    1.5.1 物化视图选择的负面因素  22-23
    1.5.2 静态物化视图选择的缺陷  23-24
  1.6 本文的工作  24
  1.7 本文的组织结构  24-26
第二章 经典物化视图的选择与调整算法  26-36
  2.1 多维物化视图的计算模型  26-31
    2.1.1 多维物化视图的尺寸计算  27
    2.1.2 多维物化视图的代价计算  27-29
    2.1.3 多维物化视图的收益计算  29-31
  2.2 静态选择算法  31-36
    2.2.1 Greedy算法  31-32
    2.2.2 YKL算法  32-33
    2.2.3 IMDVSA算法  33-36
第三章 基于MVPP的物化视图选择算法VSAA的理论基础  36-50
  3.1 VSAA算法的数学模型  36-41
    3.1.1 VSAA的维护策略  36-37
    3.1.2 VSAA的调整策略  37
    3.1.3 VSAA的视图表示  37-39
    3.1.4 VSAA代价计算模型  39-41
  3.2 VSAA关键参数  41-50
    3.2.1 物化视图的初始空间SPACE  41-43
    3.2.2 查询访问集合Q  43-47
    3.2.3 未命中查询率  47-48
    3.2.4 视图收益阈值  48-50
第四章 基于MVPP的物化视图选择算法VSAA的算法实现  50-64
  4.1 VSAA算法实现  50-54
    4.1.1 VSAA算法描述  50-53
    4.1.2 VSAA算法进一步说明  53-54
  4.2 VSAA算法分析  54-62
    4.2.1 VSAA算法的理论分析  54-56
    4.2.2 VSAA实验分析  56-62
  4.3 实验结论  62-64
第五章 结束语  64-66
  5.1 总结  64
  5.2 下一步要做的事  64-66
参考文献  66-72
附录 数据仓库的数据填充  72-76
  使用tpc-h dbgen产生数据  72-74
  将产生的数据导入oracel数据库  74-76
攻读硕士学位期间发表的论文  76-78
致谢  78

相似论文

  1. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  2. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  3. 家校互动教育平台中数据仓库的研究与应用,TP311.13
  4. 高校毕业生就业状况监测系统研究,G647.38
  5. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  6. 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
  7. PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
  8. 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
  9. 基于领域本体的海洋环境数据仓库设计,TP311.13
  10. DWMS中元数据以及缓冲区的设计和实现,TP311.13
  11. DWMS列存储中执行引擎的优化与实现,TP311.13
  12. 纺织品服装出口的TBT风险监测与预警机理研究,TP311.13
  13. 税务数据仓库系统的设计与应用,TP311.13
  14. 医疗资源管理决策支持系统的研究与实现,TP311.52
  15. 基于数据仓库的电信针对性营销支撑研究,F626;F274
  16. 基于数据挖掘技术的客户消费行为分析系统的开发与应用,TP311.13
  17. 基于数据仓库的学生管理决策支持系统设计与实现,TP311.52
  18. 基于POS数据的多维空间的营销分析,TP311.13
  19. XXX系统数据仓库的设计与实现,TP311.13
  20. 基于统计过程图的自动累加表查询优化技术研究,TP311.13
  21. 基于数据仓库的新农合管理系统研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com