学位论文 > 优秀研究生学位论文题录展示
列数据库中间结果管理和数据访问技术的研究
作 者: 赖路双
导 师: 陈虎; 荣霓
学 校: 华南理工大学
专 业: 软件工程
关键词: 列数据库 查询 内存管理 中间结果重用
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 5次
引 用: 0次
阅 读: 论文下载
内容摘要
随着社会信息化的不断发展,人们的交流方式逐渐从开始的当面交流向使用工具交流转变,如QQ、微信等;从而使得网络数据每天有上PB级甚至是几PB级的数据量的增加,导致大部分企业的现有数据库都很难有效存储、处理每天产生的网络数据,再加上企业各自每天对网络数据的分析产生的冗余信息,导致企业数据库崩溃就在所难免了。另外,由于数据格式的多样性,如单纯的网页信息、音频信息、视频信息等各种格式数据,这也是现有数据比较棘手的问题;所以,理所当然的,数据的快速的存储和有效查询等操作成为当今整个互联网的主题,而作为数据存储曾经的优良介质----数据库,就成为各大企业关注的焦点;各种对应解决方案版本的数据库也就应运而生,如现在的文件数据库,MonetDB、NoSQL等;本论文研究是基于《异构列数据库查询系统》项目进行的技术研究的;此项目主要原理是把查询语句分解成对应的原语依赖树,然后利用GPU的高度并行的特性,对原语操作进行加速;再结合CPU,把GPU计算结果进行合并,形成最终的查询结果;这种数据库主要针对的情况是在对大数据量操作时,由于物理内存空间大小的有限,而需要操作的数据量又远超过内存空间大小,并且查询操作频繁,导致内存跟硬盘的数据交换相当频繁;而由于硬盘的读写速度远远落后于内存的读写速度这种现象,提出了一种方法来减少内存和硬盘之间的交互操作,提高查询速度,即在物理层面上,对内存的分配和回收机制进行了限制,从而达到快速分配和回收内存的目的。在软件层面上,分析各个查询之间的关系,分析其中内在联系,从而达到有效使用计算过的查询来服务于当前查询,加速当前查询的速度,提高数据库的整体性能。从各项测试结果可以看出,有效的文件读取方法,能明显提高文件读取速度;而通过本文的内存管理技术,使得内存的分配和回收速度有极大提高,并且内存的利用率稳定在一个客观的百分比上;同样,通过使用中间结果重用管理技术,中间结果的重复引用的次数明显增加,极大地减少了数据库的计算负载,从而有效加速了数据库的查询速度。
|
全文目录
摘要 5-6 Abstract 6-10 第一章 绪论 10-16 1.1 选题目的及意义 10-11 1.2 论文研究内容和组织结构 11-12 1.3 MonetDB 内存管理简介 12-14 1.4 国内外相关研究情况 14-16 第二章 中间结果管理子系统 16-30 2.1 系统总体框架 17-18 2.2 中间结果子系统的总体结构 18-19 2.3 中间结果管理的数据结构 19-22 2.4 中间结果的可用性判定 22-24 2.5 中间结果的选择 24-26 2.6 中间结果之间的操作 26-28 2.7 中间结果的使用 28-29 2.8 本章总结 29-30 第三章 中间结果缓冲的内存管理 30-39 3.1 伙伴算法简介 30-31 3.2 内存管理的数据结构 31-32 3.3 内存的分配 32-34 3.4 内存的回收 34-38 3.5 本章总结 38-39 第四章 列数据库的数据文件访问 39-44 4.1 列数据文件的读取 39 4.2 排序数据文件与索引的文件结构和内存结构 39-41 4.3 排序索引文件的生成 41-42 4.4 使用索引优化查询依赖图 42-43 4.5 本章总结 43-44 第五章 系统测试结果 44-50 5.1 中间结果替换测试 44-45 5.2 内存管理测试 45-46 5.3 列数据库数据文件读取测试 46-49 5.4 本章总结 49-50 总结及展望 50-51 参考文献 51-53 致谢 53-54 附件 54
|
相似论文
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- 海量多数据库集成系统的查询处理研究,TP311.13
- 大规模稀疏关系数据索引技术研究,TP311.132.3
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 动态环境下移动对象导航系统相关技术的研究,TP301.6
- 边防军分区信息管理系统设计与实现,TP311.52
- 一种自适应选择处理节点的时空查询算法,TN929.5
- 网络搜索引擎的相关技术研究,G354
- 基于查询接口的Deep Web模式匹配方法研究,TP311.13
- Deep Web数据源发现和分类研究,TP393.09
- 基于Web的未登录词翻译技术研究,TP391.2
- 面向领域的数据库问答系统关键技术研究,TP311.13
- 矿区多源遥感影像集成管理系统的设计与实现,P208
- 能量高效的无线传感器网络数据查询算法研究,TN929.5
- 基于查询扩展的信息抽取技术研究及应用,TP391.1
- 基于.NET的数据库访问控制类组件的设计与实现,TP311.52
- 传感器网络中目标跟踪算法研究,TN929.5
- 基于不确定数据的轮廓查询处理技术研究,TP311.13
- Deep Web接口集成及查询结果排序方法研究,TP274
- Web数据库查询结果个性化分类方法研究,TP311.13
- 高校资产管理信息系统的研究与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|