学位论文 > 优秀研究生学位论文题录展示

语义数据上使用混合图的快速有效的关键字查询

作 者: 陈俊全
导 师: 俞勇
学 校: 上海交通大学
专 业: 计算机应用技术
关键词: 关键字 结构化查询 混合图 语义网 结构化数据
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 23次
引 用: 0次
阅 读: 论文下载
 

内容摘要


2001年万维网之父带姆·伯纳斯一李和他的同事在《科学天国人》上面发表的一篇科普性的文章《The Semantic Web》标志着语义万维网的诞生。语义万维网至今已经发展了十几年的时间。语义数据特点是结构和语义。常见的语义数据是RDF数据。结构化查询语言是访问语义数据的标准查询语言,例如SPARQL查询语言。但是这种结构化查询复杂的语法阻碍了语义搜索的推广。普通用户习惯于使用简单的关键字查询。虽然它在表达能力不如结构化查询语言。但是因为它快捷方便的强人优势,使得做现有的搜索引擎广泛使用。如果用户能使用关键字查询来访问RDF数据,可以使得用户不需要掌握学习曲线很陡峭的结构化查询语言,同时用户不需要理解复杂且可能快速演进的数据模式。在近几年中,把关键字转换成SPARQL查询得到了广泛的研究。现有的方法主要分为两类,一类是基于原始的RDF实例图的方法(基于RDF实例图方法)。这类方法通常能得的准确的结果,代价是运行时间会很长。另一类是基于模式图的方法(基于模式图方法),这种方法能大大加快转换的速度,但是通常精度会很低。在这篇论文中,我们提出了一个创新的方法,这种方法基于一个混合图,这个混合图能平衡转换的准确度和转换的效率。对于给定的RDF图,我们还定义了一个计分函数,这个函数能用来评估转换准确度和效率之间的权衡。这个函数能指导整个混合图的生成。在这个混合图上我们实现了一个把关键字转换成结构化查询的框架。在三个不同类型的数据集上做了实验,实验表明我们的方法对于基于实例图的方法在准确性下降不多的情况下效率上有很大提升,对于基于模式图的方法效效率下降不多的情况下准确性有很大提升。

全文目录


摘要  6-7
ABSTRACT  7-9
目录  9-12
插图索引  12-11
表格索引  11-13
第一章 引言  13-21
  1.1 动机  14-16
  1.2 贡献  16
  1.3 系统概况  16-18
  1.4 本章小结  18-21
第二章 背景知识  21-27
  2.1 本体  21
  2.2 RDF资源描述框架  21-23
  2.3 OWL Web本体语言  23-24
  2.4 链接开放数据  24
  2.5 SPARQL查询语言  24-25
  2.6 本章小结  25-27
第三章 混合图生成  27-35
  3.1 计分函数  27-28
  3.2 创建单元  28-33
  3.3 子图合并  33
  3.4 本章小结  33-35
第四章 混合图上的关键字翻译  35-39
  4.1 关键字查询  35-36
  4.2 结构化查询生成和排序  36-37
  4.3 本章小结  37-39
第五章 实验  39-45
  5.1 实验设置  39
  5.2 实验评估  39-43
  5.3 本章小结  43-45
第六章 相关工作  45-49
  6.1 XML领域的研究  45
  6.2 数据库领域的研究  45-46
  6.3 语义互联网的研究  46-47
  6.4 本章小结  47-49
第七章 结论和未来的工作  49-51
  7.1 总结  49
  7.2 未来工作  49-51
参考文献  51-55
致谢  55-57
个人简历、在学期间的研究成果及发表的论文  57

相似论文

  1. 大规模稀疏关系数据索引技术研究,TP311.132.3
  2. 概率XML数据上关键字检索算法的研究与实现,TP391.3
  3. 中山市巡逻民警治安防控质量评价系统的开发与实现,TP311.52
  4. 四川职业技术学院固定资产管理信息系统设计与实现,TP311.52
  5. 面向非结构化数据查询优化的存储系统,TP333
  6. 基于QTP的SAFFRON自动化测试框架的研究,TP311.52
  7. 基于大规模模糊RDF数据的推理引擎,TP181
  8. 一种基于动态学习框架的全自动网页结构化数据抽取方法,TP393.092
  9. 语义网自动构建中句法分析的研究,TP391.1
  10. 基于FitNium的关键字驱动的Web测试框架的研究与实现,TP311.53
  11. AraOntoLT:基于阿拉伯语文本的本体学习框架,TP391.1
  12. 基于语义网的设备知识管理,TP391.1
  13. 结合WordNet的领域语义标注研究,TP391.1
  14. 基于本体的知识管理系统的设计与实现,TP311.52
  15. 描述逻辑归结推理的研究,TP18
  16. 基于Robot技术的GUI自动化测试系统的设计与实现,TP274
  17. 移动式社会化网络服务的研究与实现,TP393.09
  18. 基于对等网络的搜索引擎关键技术研究,TP391.3
  19. 基于ASP的动态教学评估管理系统的设计与实现,TP311.52
  20. 东营市交通协管员信息管理系统设计与实现,TP311.52
  21. 非结构化数据统一访问平台及索引技术研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com