学位论文 > 优秀研究生学位论文题录展示
数据仓库中多维数据实视图选择算法研究
作 者: 窦万蕊
导 师: 段友祥;龚安
学 校: 中国石油大学
专 业: 计算机科学与技术
关键词: 数据仓库 实视图 静态选择 动态调整
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 46次
引 用: 1次
阅 读: 论文下载
内容摘要
数据仓库和联机分析处理(OLAP)是企业获取决策支持的重要手段。由于OLAP要对各种维度的多维数据进行分析,通常要访问大量数据,进行复杂的连接、聚合操作,因此如何缩短响应时间,提高查询效率变得十分关键。实视图技术通过预先存储一些中间结果可有效提高查询的执行速度,但是实视图需要占用系统存储空间,而且要增加对视图进行维护的系统开销。因此,如何在给定存储空间限制下选择一组合适的视图进行物化,最大限度提高系统的查询响应性能是课题研究的关键。通常先利用用户的预估查询物化一部分视图,然后再根据系统运行中用户所做实际查询进行动态物化。本文首先在实视图的静态选择阶段提出了一个基于蚁群-遗传算法的实视图选取策略,在基本蚁群算法中融入遗传算法。蚁群进化过程中关注最优、最差路径,采用最大、最小信息素的更新方式,为蚁群进化指明方向,有效避免蚁群盲目搜索,提高问题求解速度。在迭代过程中对路径进行遗传、交叉和局部变异操作,增强算法的全局搜索能力,使其不容易陷入局部最优,在求解的准确性和速度上都有很大提高。实验结果表明该算法能有效解决算法“早熟”问题,同时也加快了解的收敛速度。在实视图动态调整阶段,本文提出一种改进的实视图动态批量调整策略,不是每执行一个查询语句立即进行调整,而是先收集一个统计周期内的查询,对此整体调整。算法先判断查询集合是否满足调整条件,若满足则根据视图访问频率生成候选视图,再调用实视图批量选择算法,若不满足则调用实视图集动态调整算法。由于查询集合能反应用户的查询趋势,该算法不需要频繁计算,就能保持实视图集对用户查询较强的适应性。实验结果表明该算法能有效避免“抖动”产生,增强视图集的稳定性。
|
全文目录
摘要 4-5 Abstract 5-9 第一章 绪论 9-14 1.1 课题的背景及意义 9-10 1.2 国内外研究现状 10-12 1.3 论文研究内容 12 1.4 论文组织结构 12-14 第二章 数据仓库与OLAP 概述 14-22 2.1 数据仓库概述 14-17 2.1.1 数据仓库主要特征 14-15 2.1.2 数据仓库体系结构 15-16 2.1.3 数据仓库中的数据组织 16-17 2.2 OLAP 概述 17-21 2.2.1 OLAP 的定义及特征 18 2.2.2 OLAP 的多维数据模型 18-19 2.2.3 OLAP 系统的类型 19 2.2.4 多维数据模型组织 19-21 2.3 小结 21-22 第三章 物化视图选择 22-38 3.1 物化视图概述 22 3.2 物化视图选择考虑的因素 22-23 3.3 物化视图选择模型 23-27 3.3.1 格模型 24-25 3.3.2 MVPP 模型 25-26 3.3.3 AND-OR 图 26-27 3.4 物化视图静态选择算法 27-32 3.4.1 贪心算法选取物化视图 27-28 3.4.2 遗传算法选取物化视图 28-30 3.4.3 蚁群算法选取物化视图 30-32 3.5 物化视图动态调整算法 32-37 3.5.1 FPUS 动态查询集调整算法 32-34 3.5.2 基于聚类的物化视图选择算法 34-37 3.6 小结 37-38 第四章 基于蚁群-遗传算法的物化视图选取策略 38-50 4.1 VSP 问题相关定义 38-41 4.2 蚁群-遗传混合算法基本原理 41 4.3 蚁群-遗传混合算法(Ant-Genetic Algorithm,AGA) 41-47 4.3.1 编码方式 41-42 4.3.2 AGA 中蚁群算法 42-43 4.3.3 AGA 中的遗传算法 43-44 4.3.4 AGA 算法步骤及描述 44-46 4.3.5 AGA 算法分析 46-47 4.4 AGA 实验及结果分析 47-49 4.4.1 实验设计 47-48 4.4.2 实验结果 48-49 4.5 小结 49-50 第五章 物化视图动态调整算法 50-61 5.1 现有物化视图调整算法 50-51 5.2 改进的物化视图动态批量调整算法——IDBAAMV 51-58 5.2.1 相关定义 51-52 5.2.2 候选视图生成算法 52-55 5.2.3 物化视图批量选择算法 55-56 5.2.4 物化视图集动态调整算法 56-58 5.2.5 物化视图动态批量调整算法 58 5.3 实验及结果分析 58-60 5.3.1 实验设计 58-59 5.3.2 实验结果 59-60 5.4 小结 60-61 结论 61-63 参考文献 63-67 攻读硕士学位期间取得的学术成果 67-68 致谢 68
|
相似论文
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 家校互动教育平台中数据仓库的研究与应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
- 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
- 基于Web Services的电子警察系统设计与实现,TP311.52
- PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
- 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- DWMS中元数据以及缓冲区的设计和实现,TP311.13
- DWMS列存储中执行引擎的优化与实现,TP311.13
- 纺织品服装出口的TBT风险监测与预警机理研究,TP311.13
- 税务数据仓库系统的设计与应用,TP311.13
- 医疗资源管理决策支持系统的研究与实现,TP311.52
- 基于数据仓库的电信针对性营销支撑研究,F626;F274
- 基于数据挖掘技术的客户消费行为分析系统的开发与应用,TP311.13
- 基于数据仓库的学生管理决策支持系统设计与实现,TP311.52
- 基于POS数据的多维空间的营销分析,TP311.13
- XXX系统数据仓库的设计与实现,TP311.13
- 基于统计过程图的自动累加表查询优化技术研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|