学位论文 > 优秀研究生学位论文题录展示
基于存储优化模型的RDF数据查询机制研究
作 者: 吴德龙
导 师: 赵峰
学 校: 华中科技大学
专 业: 计算机应用技术
关键词: 资源描述框架 存储模型优化 RDF数据查询语言 查询优化
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 61次
引 用: 1次
阅 读: 论文下载
内容摘要
传统的对RDF(Resource Description Framework)数据存储的方法主要采用基于关系数据库方式的三元组表,但由于RDF数据的稀疏性特点,使得这种存储方式的存储空间利用率和查询效率都不高。因此有研究提出了存储模型的优化方法,这些优化方法主要基于对三元组本身的优化存储,没有考虑使用模式空间的信息对存储模型进行优化。SPARQL(Simple Protocol and Query Language)是万维网联盟推荐的RDF数据查询语言,如何在特定的存储模型上高效地支持SPARQL查询逐渐成为研究的热点。基于内存的RDF数据存储和查询系统DBLinkQL能够实现高效的SPARQL查询。DBLinkQL首先建立高效的字符串与整形标识符的映射模块,统一将三元组的字符串形式转化为整形标识符来表示,提高存储空间的利用率和查询的效率;其次DBLinkQL提取RDF的模式空间文件中的特定词汇,对这些词汇进行分类,结合垂直分割的思想,对存储结构进行多种形式的优化,进一步的优化了查询的效率。DBLinkQL支持了多种规范描述的RDF数据的导入,并可以将存储模型映射到磁盘中,可以实现内存存储模型的快速重现。DBLinkQL通过对SPARQL查询进行转换和处理,形成底层存储模型可操作的查询图模型,SPARQL查询系统对各种查询操作情况进行了处理,实现了部分支持了SPARQL查询语言;通过对底层存储数据进行统计,建立了查询连接操作的代价模型,并使用贪婪算法实现了SPARQL查询的优化模块,对查询的先后顺序进行了调整,提高了查询的性能。通过对查询优化模块进行测试,DBLinkQL存储系统的SPARQL查询优化模块对查询性能有较大的提高。性能测试表明,DBLinkQL的查询平均性能相比Jena Memory和RDF-3X要好。
|
全文目录
摘要 4-5 Abstract 5-8 1 绪论 8-17 1.1 问题的提出 8-10 1.2 国内外研究现状 10-15 1.3 研究背景及研究内容 15-16 1.4 文章组织结构 16-17 2 DBLinkQL 系统的设计 17-22 2.1 系统的设计思想 17-18 2.2 系统的总体结构 18-20 2.3 系统的工作流程 20-21 2.4 本章小结 21-22 3 RDF 数据存储优化的实现技术 22-30 3.1 字符串与整形ID 映射 22-23 3.2 模式空间三元组建立存储结构的方法 23-25 3.3 实例空间三元组数据的存储方法 25-27 3.4 统计信息的获取 27 3.5 RDF 数据的导入与序列化方法 27-29 3.6 本章小结 29-30 4 查询语言SPARQL 的实现技术 30-42 4.1 SPARQL 查询的转换和处理 30-33 4.2 SPARQL 查询的基本实现过程 33-35 4.3 SPARQL 的查询优化模块 35-38 4.4 查询计划的执行方法 38-41 4.5 本章小结 41-42 5 系统测试与分析 42-48 5.1 测试比较系统与测试数据集 42-43 5.2 测试环境 43-44 5.3 功能测试及结果分析 44-46 5.4 性能测试及结果分析 46-47 5.5 本章小结 47-48 6 总结及展望 48-50 6.1 总结 48 6.2 展望 48-50 致谢 50-52 参考文献 52-55 附录 LUBM 数据集的查询语句 55-56
|
相似论文
- 海量多数据库集成系统的查询处理研究,TP311.13
- 多核环境下内存数据库查询优化的研究,TP311.13
- 达梦嵌入式数据库的执行计划缓存研究,TP311.13
- 软件与信息服务外包平台的设计与实现,TP311.13
- 面向非结构化数据查询优化的存储系统,TP333
- 达梦嵌入式数据库子查询的实现和扁平化,TP311.13
- RFID复杂事件实时查询处理及其优化策略,TP391.44
- 基于社交网络好友关系的图查询算法研究与应用,TP391.3
- 基于本体的打印机操作语义查询系统研究与实现,TP391.1
- 基于XQuery的XBRL查询优化研究及应用,TP391.3
- 基于本体的地理信息表示与检索,P208
- 多格式海量数据统一存取的效率优化,TP311.13
- 海量数据存储与全文检索,TP333
- 粒子群算法在查询优化中的应用,TP391.3
- 一种基于DB&IR的融合查询机制的研究与实现,TP311.13
- 基于主机的银行业务系统的实现与查询优化的研究,TP311.13
- 基于堆栈的择优遗传禁忌查询优化算法的设计与实现,TP311.13
- 调度算法在单车核算系统中的应用研究,F270.7
- 一个查询优化器的查询优化方法与实现技术研究,TP311.13
- 批处理提交数据模式在IBM大型机上的实现与DB2查询优化的研究,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|