学位论文 > 优秀研究生学位论文题录展示
数据仓库中物化视图选择算法的研究
作 者: 钟静华
导 师: 冯少荣
学 校: 厦门大学
专 业: 计算机应用
关键词: 数据仓库 物化视图 静态选择 动态调整
分类号: TP311.13
类 型: 硕士论文
年 份: 2006年
下 载: 117次
引 用: 1次
阅 读: 论文下载
内容摘要
数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员的决策。它维护着海量的数据,所支持的查询形式复杂,通常需要访问大量数据,而一个决策支持系统必须对查询做出快速响应。因此如何高效的管理如此之多的数据是数据仓库面临的其中一个难题,而物化视图是解决这个问题的重要手段,但是它需要额外的系统空间来存储,并且需要牺牲系统的代价来维护(maintenance),因此,选择哪些视图加以物化是一个重要的研究主题。本文的研究内容就是分别从静态和动态两方面,考虑物化视图的选择问题。物化视图的静态选择算法是基于查询分布概率已经由用户提供,或这些查询在综合数据上是均匀分布的前提下。本文在第三章中首先介绍了三种常用的物化视图静态选择算法,并分析了它们的优缺点;其次提出了优化的代价模型,其中不仅考虑了查询代价,而且还考虑了更新代价;最后在改进的代价模型基础上,提出了物化视图的遗传选择算法(Genetic Algorithm on Materialized View,简称GAMV),该算法属于静态选择算法。由于在实际应用中,用户查询均匀分布的假设常常不能成立,由用户来提供查询分布概率也是强人所难的,所以引入了物化视图的动态调整。在第四章中,首先介绍了物化视图的动态调整方案的研究现状,并分析其优缺点;其次根据用户查询的多样性特征,提出了基于粗糙集聚类的物化视图动态调整算法(Rough Set Clustering-Based Materialized View Dynamic Adjustment Algorithm,简称RSCMVDA),该算法是在对物化视图进行粗糙集聚类的基础上,进行动态调整,它不仅可以满足用户查询多样性需求,也可以考虑到维的层次关系因素;最后通过实验得出结论,随着用户查询集合的增加,采用GAMV算法和RSCMVDA算法相结合的做法,会比单纯采用遗传算法更加优化,这是因为随着查询集合的增大,用户查询分布情况发生显著变化的概率比较高。
|
全文目录
摘要 4-5 Abstract 5-10 第一章 引言 10-13 1.1 数据仓库研究背景 10-11 1.2 本文研究内容 11-12 1.3 本文组织 12-13 第二章 数据仓库概述 13-38 2.1 数据仓库的定义及特点 13-16 2.2 数据仓库的体系结构 16-18 2.3 基本概念 18-23 2.3.1 维及其层次 18-19 2.3.2 事实数据 19 2.3.3 主题 19 2.3.4 粒度 19-20 2.3.5 数据立方体 20-22 2.3.6 视图 22 2.3.7 元数据 22-23 2.4 联机分析处理概述 23-28 2.4.1 OLAP 的定义 23-24 2.4.2 OLAP 的特性 24-25 2.4.3 OLAP 系统的类型 25-27 2.4.4 OLAP 的多维数据分析 27-28 2.5 多维数据模型 28-34 2.5.1 多维数据模型的分类 28-32 2.5.2 在ROLAP 上实现多维数据模型 32-34 2.6 数据仓库的物理设计 34-38 2.6.1 索引的结构及其用途 34-35 2.6.2 物化视图及其研究现状 35-38 第三章 物化视图的静态选择算法 38-50 3.1 面向数据仓库的查询 38-39 3.2 多维数据格 39-40 3.3 物化视图的选择问题 40-41 3.4 代价模型 41 3.5 现有的物化视图选择算法 41-44 3.5.1 Greedy 算法 42-43 3.5.2 BPUS 算法 43 3.5.3 PBS 算法 43-44 3.6 物化视图的遗传选择算法 44-50 3.6.1 遗传算法的一般结构 44-45 3.6.2 视图的二进制表示 45-46 3.6.3 适应性函数 46-47 3.6.4 遗传算子 47-48 3.6.5 修正算法 48-50 第四章 物化视图的动态调整算法 50-65 4.1 动态调整算法的引入 50 4.2 现有的动态调整算法 50-51 4.3 基于粗糙集聚类的物化视图动态调整算法 51-65 4.3.1 算法概述 51-52 4.3.2 基于粗糙集的物化视图聚类 52-58 4.3.3 动态调整物化视图的时机 58-59 4.3.4 动态调整算法 59-62 4.3.5 实验结果 62-65 第五章 结束语 65-66 参考文献 66-69 研究生期间发表的论文和参加的项目 69-70 发表过的论文: 69 参加过的项目: 69-70 致 谢 70
|
相似论文
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 家校互动教育平台中数据仓库的研究与应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
- 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
- PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
- 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- DWMS中元数据以及缓冲区的设计和实现,TP311.13
- DWMS列存储中执行引擎的优化与实现,TP311.13
- 纺织品服装出口的TBT风险监测与预警机理研究,TP311.13
- 税务数据仓库系统的设计与应用,TP311.13
- 医疗资源管理决策支持系统的研究与实现,TP311.52
- 基于数据仓库的电信针对性营销支撑研究,F626;F274
- 基于数据挖掘技术的客户消费行为分析系统的开发与应用,TP311.13
- 基于数据仓库的学生管理决策支持系统设计与实现,TP311.52
- 基于POS数据的多维空间的营销分析,TP311.13
- XXX系统数据仓库的设计与实现,TP311.13
- 基于统计过程图的自动累加表查询优化技术研究,TP311.13
- 基于数据仓库的新农合管理系统研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|