学位论文 > 优秀研究生学位论文题录展示

并行数据库系统PBASE/3数据缓冲技术研究

作 者: 周胜
导 师: 林宗楷;王珊
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机应用技术
关键词: 数据缓冲 并行数据库 缓冲区管理 多查询优化
分类号: TP311.13
类 型: 博士论文
年 份: 2000年
下 载: 186次
引 用: 1次
阅 读: 论文下载
 

内容摘要


早期并行数据库系统的研究重点主要集中在并行数据库的物理组织、操作算法、优化和调度策略上,而对于具体的执行机制则很少涉及,实际上系统资源管理的效率特别是缓冲区管理的效率是影响数据库系统性能的一个重要因素,本文将结合我们自己的PBASE/3系统对并行数据库系统的数据缓存技术展开研究。 本文首先根据数据缓冲的粒度、以及数据的共享级别将数据缓冲技术分为四类:基表页面缓冲、临时表页面缓冲、复杂操作中间结果集缓冲,以及多查询公共结果集缓冲,然后分别就这四种缓冲技术展开分析。 在本文的第一部分,首先详细分析了PBASE/3系统中不同数据库操作的行为模式,并根据不同的数据操作模式提出了操作内的数据缓冲管理策略,然后进一步综合考虑操作竞争和系统优化信息,提出了一种抢占式的基表页面缓冲区管理策略。 本文第二部分的研究重点是查询内的数据缓冲问题,具体可以分为两类:临时表页面缓冲和复杂操作中间结果集缓冲。在第二部分中,首先分析了临时表的基本访问模式,比较了基表缓冲和临时表缓冲的异同,提出了一个统一的管理策略。 复杂操作结果集的缓冲技术(我们称为CACHE技术)是针对循环执行的复杂操作而提出的,在本文的第二部分用四章的篇幅对这个问题展开研究。首先分析了应用这种缓冲模式的环境及其基本特点,然后提出了集中式环境下,CACHE技术的两种基本结构,并针对CACHE的基本特点提出了独特的管理策略LRV。由于我们的研究目标是并行数据库,所以我们进一步分析了并行环境下CACHE技术的基本问题,提出了两种基于并行环境的CACHE结构,以及相应的管理策略。在第二部分的最后,本文从代价优化和负载平衡的角度分析了不同CACHE结构的优劣,并提出了一种主动调度策略适应并行CACHE结构的需求。 本文第三部分的研究重点是多查询公共操作CO的结果集共享。CO结果集缓冲技术的独特性在于它兼具磁盘页面缓冲和操作结果集缓冲的特点,所以在处理多查询处理时,以磁盘页面缓冲技术为基础,同时考虑到多查询应用环境的特殊性,充分利用多查询优化调度器提供的启发式信息指导缓冲区管理,以提高多查询缓冲的效率。

全文目录


独创性声明  2
关于论文使用授权的说明  2-5
摘要  5-6
英文摘要  6-12
第一章 引言  12-24
  1.1 并行数据库系统的早期研究  12-16
  1.2 PBASE/3的开发背景和体系结构  16-20
    1.2.1 PBASE/3的开发背景简介  16-18
    1.2.2 PBASE/3的基本结构  18-20
  1.3 本文的研究内容  20-24
第二章 面向基表的磁盘页面缓冲研究  24-46
  2.1 缓冲管理策略研究概述  24-29
    2.1.1 简单缓冲区管理算法  25-26
    2.1.2 基于操作特性的缓冲区管理策略  26-29
  2.2 PBASE/3磁盘页面缓冲结构概述  29-30
  2.3 PBASE/3查询操作行为模型分析  30-34
    2.3.1 顺序扫描模式  31
    2.2.2.随机存取模式  31-32
    2.2.3 索引存取模式  32-34
  2.4 PBASE/3的缓冲区管理策略  34-39
    2.4.1 内淘汰策略  34-35
    2.4.2 外淘汰策略  35-39
  2.5 PBASE/3磁盘页面缓冲区的设计  39-44
    2.5.1 缓冲区基本数据结构  39-40
    2.5.2 缓冲区管理策略  40-44
  2.6 本章小结  44-46
第三章 查询内缓冲技术研究  46-68
  3.1 两种查询内缓冲  46-49
  3.2 主存虚表的缓冲处理  49-51
    3.2.1 主存虚表的访问模式  49-50
    3.2.2 与磁盘虚表的区别与联系  50-51
  3.3 CACHE的存取模式  51-53
  3.4 CACHE的初始分配策略  53-58
    3.4.1 确定Smax  54-56
    3.4.2 确定Smin  56
    3.4.3 确定Sini  56-58
  3.5 CACHE淘汰策略  58-63
  3.6 CACHE的两级缓冲结构  63-66
  3.7 本章小结  66-68
第四章 并行数据库的CACHE结构  68-88
  4.1 并行数据库系统下CACHE结构的基本问题  69-74
    4.1.1 并行结构下CACHE的数量  70-72
    4.1.2 并行结构下CACHE的分布  72-73
    4.1.3 并行结构下CACHE的访问模式  73-74
  4.2 PBASE/3中的并行CACHE结构  74-81
    4.2.1 PBASE/3的流分片策略  75-79
    4.2.2 A)、B)数据流向结构下的CACHE结构  79-80
    4.2.3 C)数据流向结构下的并行CACHE结构  80-81
  4.3 并行结构下单级CACHE管理策略  81-85
    4.3.1 并行单级CACHE的存取模式  81-82
    4.3.2 并行结构下单级CACHE的载入和访问策略  82-84
    4.3.3 并行结构下单级CACHE的淘汰策略  84-85
  4.4 并行结构下两级CACHE管理策略  85-86
  4.5 本章小结  86-88
第五章 CACHE与代价优化和负载平衡  88-116
  5.1 PBASE/3的两阶段查询优化技术  88-92
    5.1.1 PBASE/3并行查询优化概述  88-89
    5.1.2 PBASE/3的两阶段优化策略概述  89-92
  5.2 集中式CACHE代价分析  92-102
    5.2.1 单级CACHE结构代价分析  93-97
    5.2.2 两级CACHE结构代价分析  97-101
    5.2.3 集中式CACHE代价小结  101-102
  5.3 并行CACHE与负载平衡  102-113
    5.3.1 并行CACHE结构代价分析  102-104
    5.3.2 PBASE/3的网络两级缓存结构及代价分析  104-107
    5.3.3 PBASE/3系统负载平衡模型  107-109
    5.3.4 并行CACHE与负载平衡  109-110
    5.3.5 并行CACHE与主动调度策略  110-113
  5.4 本章小结  113-116
第六章 PBASE/3 CACHE结构的设计  116-134
  6.1 网络两级缓存结构的数据组织结构  116-120
  6.2 网络两级缓存结构的数据管理策略  120-128
    6.2.1 小粒度数据管理策略  120-127
    6.2.2 对中粒度和大粒度数据的管理策略  127-128
  6.3 PBASE/3对网络缓存结构的支持  128-133
    6.3.1 并行数据库系统资源向量信息管理策略分析  128-131
    6.3.2 PBASE/3的系统资源向量信息管理策略  131-133
  6.4 本章小结  133-134
第七章 多查询缓冲技术研究  134-144
  7.1 PBASE/3并行多查询优化技术  134-138
    7.1.1 并行多查询优化技术概述  135
    7.1.2 PBASE/3的多阶段并行多处理方案  135-138
  7.2 多查询缓冲技术的特点  138-140
  7.3 PBASE/3的多查询缓冲技术  140-142
  7.4 本章小结  142-144
第八章 总结  144-147
附录A 几种经典缓冲区淘汰策略分析  147-153
  A.1 随机访问模式下淘汰策略性能比较  147-149
  A.2 循环访问模式下淘汰策略性能比较  149-150
  A.3 顺序访问模式下淘汰策略性能比较  150
  A.4 顺序访问局部循环模式下淘汰策略性能比较  150-151
  A.5 本章小结  151-153
附录B LRV缓冲策略及三种缓存结构性能分析  153-161
  B.1 LRV与LRU性能比较  153-154
  B.2 单结点单级缓存结构与两级缓存结构性能比较  154-156
  B.3 磁盘两级缓存结构与网络两级缓存结构性能比较  156-160
  B.4 本章小结  160-161
附录C 中间结果大小的估计  161-167
  C.1 统计信息  161-162
  C.2 操作的结果大小估计  162-167
参考文献  167-174
致谢  174-175
作者简历  175-176

相似论文

  1. DWMS中元数据以及缓冲区的设计和实现,TP311.13
  2. 移动综合应急预警系统的设计与实现,TN929.5
  3. 基于仿真模拟技术的数据缓冲区自适应优化研究,TP311.13
  4. 闪存存储设备仿真平台与应用研究,TP333
  5. 无线传感器网络中面向节能的多查询优化研究,TN929.5
  6. 嵌入式机顶盒流媒体播放技术研究与实现,TN948.55
  7. 分布式实时数据库中缓冲区管理和负载平衡算法研究,TP311.13
  8. 基于Oracle的数据迁移优化方法研究,TP311.13
  9. 数据库并行查询优化的设计与实现,TP311.13
  10. 高速海量固态硬盘的实现,TP333
  11. 基于动态缓冲管理的片上网络体系结构研究,TN47
  12. Oracle数据库容灾技术应用研究,TP311.13
  13. 混合NAND型闪存实验平台的研究,TP333
  14. CS-CS流媒体低层同步控制机制的设计和实现,TN919.8
  15. 以串行存储器为核心的多机异种通信数据上传系统,TP273
  16. Oracle数据库容灾技术应用与研究,TP311.138
  17. 一种嵌入式移动实时数据库管理系统缓冲区管理机制研究,TP311.13
  18. 海量数据分析处理方法的研究,TP311.13
  19. 千兆网络报文捕获平台的设计与实现,TP393.08
  20. 对等网络直播系统的数据共享机制研究,TP393.08
  21. 面向广域流动群体的管理和预测技术研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com