学位论文 > 优秀研究生学位论文题录展示

基于存储优化模型的RDF数据查询机制研究

作 者: 吴德龙
导 师: 赵峰
学 校: 华中科技大学
专 业: 计算机应用技术
关键词: 资源描述框架 存储模型优化 RDF数据查询语言 查询优化
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 61次
引 用: 1次
阅 读: 论文下载
 

内容摘要


传统的对RDF(Resource Description Framework)数据存储的方法主要采用基于关系数据库方式的三元组表,但由于RDF数据的稀疏性特点,使得这种存储方式的存储空间利用率和查询效率都不高。因此有研究提出了存储模型的优化方法,这些优化方法主要基于对三元组本身的优化存储,没有考虑使用模式空间的信息对存储模型进行优化。SPARQL(Simple Protocol and Query Language)是万维网联盟推荐的RDF数据查询语言,如何在特定的存储模型上高效地支持SPARQL查询逐渐成为研究的热点。基于内存的RDF数据存储和查询系统DBLinkQL能够实现高效的SPARQL查询。DBLinkQL首先建立高效的字符串与整形标识符的映射模块,统一将三元组的字符串形式转化为整形标识符来表示,提高存储空间的利用率和查询的效率;其次DBLinkQL提取RDF的模式空间文件中的特定词汇,对这些词汇进行分类,结合垂直分割的思想,对存储结构进行多种形式的优化,进一步的优化了查询的效率。DBLinkQL支持了多种规范描述的RDF数据的导入,并可以将存储模型映射到磁盘中,可以实现内存存储模型的快速重现。DBLinkQL通过对SPARQL查询进行转换和处理,形成底层存储模型可操作的查询图模型,SPARQL查询系统对各种查询操作情况进行了处理,实现了部分支持了SPARQL查询语言;通过对底层存储数据进行统计,建立了查询连接操作的代价模型,并使用贪婪算法实现了SPARQL查询的优化模块,对查询的先后顺序进行了调整,提高了查询的性能。通过对查询优化模块进行测试,DBLinkQL存储系统的SPARQL查询优化模块对查询性能有较大的提高。性能测试表明,DBLinkQL的查询平均性能相比Jena Memory和RDF-3X要好。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-17
  1.1 问题的提出  8-10
  1.2 国内外研究现状  10-15
  1.3 研究背景及研究内容  15-16
  1.4 文章组织结构  16-17
2 DBLinkQL 系统的设计  17-22
  2.1 系统的设计思想  17-18
  2.2 系统的总体结构  18-20
  2.3 系统的工作流程  20-21
  2.4 本章小结  21-22
3 RDF 数据存储优化的实现技术  22-30
  3.1 字符串与整形ID 映射  22-23
  3.2 模式空间三元组建立存储结构的方法  23-25
  3.3 实例空间三元组数据的存储方法  25-27
  3.4 统计信息的获取  27
  3.5 RDF 数据的导入与序列化方法  27-29
  3.6 本章小结  29-30
4 查询语言SPARQL 的实现技术  30-42
  4.1 SPARQL 查询的转换和处理  30-33
  4.2 SPARQL 查询的基本实现过程  33-35
  4.3 SPARQL 的查询优化模块  35-38
  4.4 查询计划的执行方法  38-41
  4.5 本章小结  41-42
5 系统测试与分析  42-48
  5.1 测试比较系统与测试数据集  42-43
  5.2 测试环境  43-44
  5.3 功能测试及结果分析  44-46
  5.4 性能测试及结果分析  46-47
  5.5 本章小结  47-48
6 总结及展望  48-50
  6.1 总结  48
  6.2 展望  48-50
致谢  50-52
参考文献  52-55
附录 LUBM 数据集的查询语句  55-56

相似论文

  1. 海量多数据库集成系统的查询处理研究,TP311.13
  2. 多核环境下内存数据库查询优化的研究,TP311.13
  3. 达梦嵌入式数据库的执行计划缓存研究,TP311.13
  4. 软件与信息服务外包平台的设计与实现,TP311.13
  5. 面向非结构化数据查询优化的存储系统,TP333
  6. 达梦嵌入式数据库子查询的实现和扁平化,TP311.13
  7. RFID复杂事件实时查询处理及其优化策略,TP391.44
  8. 基于社交网络好友关系的图查询算法研究与应用,TP391.3
  9. 基于本体的打印机操作语义查询系统研究与实现,TP391.1
  10. 基于XQuery的XBRL查询优化研究及应用,TP391.3
  11. 基于本体的地理信息表示与检索,P208
  12. 多格式海量数据统一存取的效率优化,TP311.13
  13. 海量数据存储与全文检索,TP333
  14. 粒子群算法在查询优化中的应用,TP391.3
  15. 一种基于DB&IR的融合查询机制的研究与实现,TP311.13
  16. 基于主机的银行业务系统的实现与查询优化的研究,TP311.13
  17. 基于堆栈的择优遗传禁忌查询优化算法的设计与实现,TP311.13
  18. 调度算法在单车核算系统中的应用研究,F270.7
  19. 一个查询优化器的查询优化方法与实现技术研究,TP311.13
  20. 批处理提交数据模式在IBM大型机上的实现与DB2查询优化的研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com