学位论文 > 优秀研究生学位论文题录展示

基于统计过程图的自动累加表查询优化技术研究

作 者: 冯璨
导 师: 黄学文
学 校: 大连理工大学
专 业: 企业管理
关键词: 数据仓库 粒度 查询统计 自动累加表 统计过程图
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 24次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着信息技术的不断深入发展,全球已步入信息化时代,越来越多的企业将信息化管理视为企业建设的重点项目,项目的跟进带来了工作流程的深化,应用系统中需要处理的数据也随之迅速增长,数据库系统和数据仓库系统正越来越成为工作中不可或缺的一部分。在商务数据库和数据仓库系统中,数据分析人员为了生成对管理决策有用的报表,通常会频繁地抽取数据并进行查询统计。报表涉及的数据往往容量很大,而对大容量数据的查询通常会伴随着复杂的联接操作和聚集操作。传统的技术在查询统计的过程中经常会取消数据库和数据仓库的访问权限,给系统的正常运行带来了很大的不便。同时,传统的查询通常会消耗很多时间,不能满足快速响应的要求。因此,使用何种技术来提高查询统计的效率并实现系统快速响应是一个亟待解决的技术问题。本文首先分析了原子视角和粒度的概念,并给出明确定义用于区分查询和统计。然后,找出数据库系统中所有的维,按照一定规则对其排序,同时对聚集操作的原子化过程进行了详细分析,并将统计规划为包含了筛选条件和聚集操作的集合,当统计涉及的维集合和聚集操作相等时,把这两个统计划分为同谱系的统计,使统计过程具备了清晰的层次。最后,通过统计过程图和自动累加表的选择算法找到候选表,系统在查询时通过对这些相互逻辑独立的自动累加表进行访问而不是对基本表的访问来实现效率的大幅提升。另外,本文给出了在.NET平台和SQL Server数据库的开发环境下如何实施该技术的一些细节问题,通过上线系统的运行效果来看,基于统计过程图的自动累加表技术解决了大容量数据库系统对报表查询的响应时间问题,有效地改善了系统运行的状况。基于统计过程图的自动累加表是一种借鉴了物化视图的以空间换取时间的技术,可以有效针对那些包含了大量多表联接和复杂聚集函数查询的优化技术。该项技术的特点是将以往复杂的查询操作分摊到平时的业务中,在每日结算的过程中已经将大量统计工作完成,避免了传统大规模的查询。该技术可以有效的扩充现有的查询优化理论,对于指导开发有关大规模数据的报表查询优化技术有一定的意义。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-15
  1.1 研究背景  9-10
  1.2 项目背景和研究意义  10-12
  1.3 论文结构  12-13
  1.4 论文研究内容  13-15
2 理论综述  15-28
  2.1 传统的查询优化  15-16
  2.2 基于智能算法的查询优化  16-18
  2.3 查询效率优化  18-28
    2.3.1 基于数据库设计的优化  18-21
    2.3.2 数据仓库中的查询优化  21-28
3 售票业务需求分析  28-40
  3.1 系统整体功能架构  28-31
  3.2 相关业务流程  31-38
  3.3 售票系统解决的问题  38
  3.4 传统系统存在的问题  38-40
4 查询优化模型  40-51
  4.1 相关概念  40-45
    4.1.1 事实表与维表  40-42
    4.1.2 原子视角和粒度  42
    4.1.3 层次和级别  42-44
    4.1.4 聚集函数  44
    4.1.5 查询和统计  44-45
  4.2 查询统计匹配模型  45-51
    4.2.1 维的有序规划  45
    4.2.2 聚集操作的原子化  45-46
    4.2.3 统计的规划  46-47
    4.2.4 统计过程图  47-49
    4.2.5 基于统计过程图的AST选择算法  49-51
5 应用算例  51-59
  5.1 Northwind数据库简介  51-52
  5.2 Northwind数据库维度谱系分析  52-54
  5.3 实验数据分析  54-57
  5.4 AST技术的实施效果  57-58
  5.5 小结  58-59
6 结论  59-60
参考文献  60-64
攻读硕士学位期间发表学术论文情况  64-65
致谢  65-66

相似论文

  1. 微粉的粒度组合对水泥混凝土性能的影响,TU528.041
  2. 昆山绰墩农业遗址中存在古水稻土层的矿物学和地球化学证据,S-09
  3. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  4. 知识粒度的计算及其在属性约简中的应用研究,TP18
  5. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  6. 家校互动教育平台中数据仓库的研究与应用,TP311.13
  7. 高校毕业生就业状况监测系统研究,G647.38
  8. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  9. 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
  10. PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
  11. 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
  12. 基于领域本体的海洋环境数据仓库设计,TP311.13
  13. 支持流量疏导的多粒度光网络生存性研究,TN929.1
  14. DWMS中元数据以及缓冲区的设计和实现,TP311.13
  15. DWMS列存储中执行引擎的优化与实现,TP311.13
  16. 纺织品服装出口的TBT风险监测与预警机理研究,TP311.13
  17. 税务数据仓库系统的设计与应用,TP311.13
  18. 燃油喷雾粒度分布测量及其信息熵分析,TK407.9
  19. 医疗资源管理决策支持系统的研究与实现,TP311.52
  20. Ni电极浆料性能的研究及在叠层片式PTCR中的应用,TN04
  21. 基于数据仓库的电信针对性营销支撑研究,F626;F274

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com