学位论文 > 优秀研究生学位论文题录展示

数据仓库中多维数据实视图选择算法研究

作 者: 窦万蕊
导 师: 段友祥;龚安
学 校: 中国石油大学
专 业: 计算机科学与技术
关键词: 数据仓库 实视图 静态选择 动态调整
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 46次
引 用: 1次
阅 读: 论文下载
 

内容摘要


数据仓库和联机分析处理(OLAP)是企业获取决策支持的重要手段。由于OLAP要对各种维度的多维数据进行分析,通常要访问大量数据,进行复杂的连接、聚合操作,因此如何缩短响应时间,提高查询效率变得十分关键。实视图技术通过预先存储一些中间结果可有效提高查询的执行速度,但是实视图需要占用系统存储空间,而且要增加对视图进行维护的系统开销。因此,如何在给定存储空间限制下选择一组合适的视图进行物化,最大限度提高系统的查询响应性能是课题研究的关键。通常先利用用户的预估查询物化一部分视图,然后再根据系统运行中用户所做实际查询进行动态物化。本文首先在实视图的静态选择阶段提出了一个基于蚁群-遗传算法的实视图选取策略,在基本蚁群算法中融入遗传算法。蚁群进化过程中关注最优、最差路径,采用最大、最小信息素的更新方式,为蚁群进化指明方向,有效避免蚁群盲目搜索,提高问题求解速度。在迭代过程中对路径进行遗传、交叉和局部变异操作,增强算法的全局搜索能力,使其不容易陷入局部最优,在求解的准确性和速度上都有很大提高。实验结果表明该算法能有效解决算法“早熟”问题,同时也加快了解的收敛速度。在实视图动态调整阶段,本文提出一种改进的实视图动态批量调整策略,不是每执行一个查询语句立即进行调整,而是先收集一个统计周期内的查询,对此整体调整。算法先判断查询集合是否满足调整条件,若满足则根据视图访问频率生成候选视图,再调用实视图批量选择算法,若不满足则调用实视图集动态调整算法。由于查询集合能反应用户的查询趋势,该算法不需要频繁计算,就能保持实视图集对用户查询较强的适应性。实验结果表明该算法能有效避免“抖动”产生,增强视图集的稳定性。

全文目录


摘要  4-5
Abstract  5-9
第一章 绪论  9-14
  1.1 课题的背景及意义  9-10
  1.2 国内外研究现状  10-12
  1.3 论文研究内容  12
  1.4 论文组织结构  12-14
第二章 数据仓库与OLAP 概述  14-22
  2.1 数据仓库概述  14-17
    2.1.1 数据仓库主要特征  14-15
    2.1.2 数据仓库体系结构  15-16
    2.1.3 数据仓库中的数据组织  16-17
  2.2 OLAP 概述  17-21
    2.2.1 OLAP 的定义及特征  18
    2.2.2 OLAP 的多维数据模型  18-19
    2.2.3 OLAP 系统的类型  19
    2.2.4 多维数据模型组织  19-21
  2.3 小结  21-22
第三章 物化视图选择  22-38
  3.1 物化视图概述  22
  3.2 物化视图选择考虑的因素  22-23
  3.3 物化视图选择模型  23-27
    3.3.1 格模型  24-25
    3.3.2 MVPP 模型  25-26
    3.3.3 AND-OR 图  26-27
  3.4 物化视图静态选择算法  27-32
    3.4.1 贪心算法选取物化视图  27-28
    3.4.2 遗传算法选取物化视图  28-30
    3.4.3 蚁群算法选取物化视图  30-32
  3.5 物化视图动态调整算法  32-37
    3.5.1 FPUS 动态查询集调整算法  32-34
    3.5.2 基于聚类的物化视图选择算法  34-37
  3.6 小结  37-38
第四章 基于蚁群-遗传算法的物化视图选取策略  38-50
  4.1 VSP 问题相关定义  38-41
  4.2 蚁群-遗传混合算法基本原理  41
  4.3 蚁群-遗传混合算法(Ant-Genetic Algorithm,AGA)  41-47
    4.3.1 编码方式  41-42
    4.3.2 AGA 中蚁群算法  42-43
    4.3.3 AGA 中的遗传算法  43-44
    4.3.4 AGA 算法步骤及描述  44-46
    4.3.5 AGA 算法分析  46-47
  4.4 AGA 实验及结果分析  47-49
    4.4.1 实验设计  47-48
    4.4.2 实验结果  48-49
  4.5 小结  49-50
第五章 物化视图动态调整算法  50-61
  5.1 现有物化视图调整算法  50-51
  5.2 改进的物化视图动态批量调整算法——IDBAAMV  51-58
    5.2.1 相关定义  51-52
    5.2.2 候选视图生成算法  52-55
    5.2.3 物化视图批量选择算法  55-56
    5.2.4 物化视图集动态调整算法  56-58
    5.2.5 物化视图动态批量调整算法  58
  5.3 实验及结果分析  58-60
    5.3.1 实验设计  58-59
    5.3.2 实验结果  59-60
  5.4 小结  60-61
结论  61-63
参考文献  63-67
攻读硕士学位期间取得的学术成果  67-68
致谢  68

相似论文

  1. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  2. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  3. 家校互动教育平台中数据仓库的研究与应用,TP311.13
  4. 高校毕业生就业状况监测系统研究,G647.38
  5. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  6. 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
  7. 基于Web Services的电子警察系统设计与实现,TP311.52
  8. PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
  9. 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
  10. 基于领域本体的海洋环境数据仓库设计,TP311.13
  11. DWMS中元数据以及缓冲区的设计和实现,TP311.13
  12. DWMS列存储中执行引擎的优化与实现,TP311.13
  13. 纺织品服装出口的TBT风险监测与预警机理研究,TP311.13
  14. 税务数据仓库系统的设计与应用,TP311.13
  15. 医疗资源管理决策支持系统的研究与实现,TP311.52
  16. 基于数据仓库的电信针对性营销支撑研究,F626;F274
  17. 基于数据挖掘技术的客户消费行为分析系统的开发与应用,TP311.13
  18. 基于数据仓库的学生管理决策支持系统设计与实现,TP311.52
  19. 基于POS数据的多维空间的营销分析,TP311.13
  20. XXX系统数据仓库的设计与实现,TP311.13
  21. 基于统计过程图的自动累加表查询优化技术研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com