学位论文 > 优秀研究生学位论文题录展示

基于关键词的语义搜索

作 者: 周琦
导 师: 俞勇
学 校: 上海交通大学
专 业: 计算机应用技术
关键词: 语义搜索 本体 RDF OWL SPARQL 关键词
分类号: TP391.3
类 型: 硕士论文
年 份: 2009年
下 载: 395次
引 用: 1次
阅 读: 论文下载
 

内容摘要


语义搜索虽然提出多年,但是为了能够运用精确的语义搜索技术,用户必须熟知本体中的结构和相应的知识表示,并且具备写形式化查询语言的能力。所以目前语义搜索的应用人群往往还停留在专家用户这个层面上,这已经成为阻碍语义搜索发展的严峻问题。在另一方面,广大的互联网用户仍然习惯于传统基于关键词的搜索方式,即使搜索引擎提供了简单的布尔表达式查询来增加查询的准确性,然而几乎所有的用户都不用这种最简单的逻辑表达式来进行日常的查询。所以,如果能够将关键词查询这种方式无缝地衔接到语义搜索上,那么对于互联网搜索的广大用户来说,他们就可以凭借习惯的关键词作为手段而达到语义搜索的准确结果。本文提出了一种将用户输入的关键字自动翻译,并且排序成语义搜索查询的方法,并且实现了系统原型SPARK来验证我们的方法。这样通过输入关键词,用户就能获得语义搜索引擎所能接受的形式化语义查询。但由于关键词和语义查询之间的巨大差异,有三个主要的难点需要克服:1)关键词的歧义性:同一个关键词在不同的背景下有不同的含义,如何区分用户想要表达的真正含义是一个重要的问题。2)关系的缺失:在传统的关键词搜索中,词与词之间没有显式的修饰关系,如何区别查询的主要部分和修饰部分的关系非常困难。3)翻译结果的多样性:歧义性和属性缺失会造成大量可能的查询,如何挑选出符合用户信息需求的查询就显得非常重要。为了解决以上的问题,我们针对性提出了将关键词翻译成为系统所能接受的语义查询的三阶段步骤:通过多种单词-本体资源匹配方法解决了多义问题,通过有效的查询图生成算法较好地解决了关系缺失的问题,最后通过查询排序的方法对生成的语义查询进行评价,向用户反馈相关的语义搜索查询。在SPARK的实现中,用户可以输入任意表达信息需求的关键词,系统根据算法最后生成一系列符合用户信息需求并且可以被语义搜索接受的SPARQL查询语句反馈给用户,或用户可以直接将这些SPARQL查询提交给执行引擎以获得语义搜索的结果。实验表明,本文提出的方法在转化查询的质量上达到了比较好的效果,也证明通过关键字可以进行有效的语义搜索,这点对于语义搜索的推广和用户的普是有跨时代意义的。此外,我们还分析了目前方法的不足之处,并对进一步的研究进行了讨论。

全文目录


摘要  2-4
ABSTRACT  4-11
1 引言  11-15
2 背景知识  15-21
  2.1 语义网和语义搜索  15-16
  2.2 本体的概念  16-17
  2.3 本体定义语言RDFOWL  17-18
  2.4 SPARQL 查询语言  18-20
  2.5 本章小结  20-21
3 相关工作  21-28
  3.1 基于数据库的研究  21-22
  3.2 基于XML 数据的研究  22-23
  3.3 基于本体的研究  23-26
    3.3.1 自然语言搜索  23-24
    3.3.2 关键字搜索  24-25
    3.3.3 切面搜索  25-26
  3.4 本章小结  26-28
4 系统框架  28-33
  4.1 基本思想  28-29
  4.2 形式化定义  29-31
  4.3 系统框架  31-32
  4.4 本章小结  32-33
5 单词-本体资源匹配  33-37
  5.1 本体索引和词典  34
  5.2 匹配方法  34-36
  5.3 本章小结  36-37
6 查询图的生成  37-43
  6.1 问题分析  37-38
  6.2 生成方案  38-40
    6.2.1 转换过程  38-40
  6.3 优化算法  40-42
  6.4 本章小结  42-43
7 查询排序  43-51
  7.1 基本假设  43-44
  7.2 从关键词来衡量相关性  44-46
  7.3 从本体知识库衡量相关性  46-47
  7.4 两种方法的结合  47-48
  7.5 生成SPARQL 语言  48-49
    7.5.1 SELECT 查询目标  49
    7.5.2 WHERE 限定模式  49
  7.6 本章小结  49-51
8 系统实现与评测  51-63
  8.1 系统实现  52
  8.2 实验设置  52-55
    8.2.1 数据  52-53
    8.2.2 查询  53-54
    8.2.3 客观评判准则  54-55
    8.2.4 主观评判准则  55
  8.3 实验结果  55-61
    8.3.1 系统性能  55-56
    8.3.2 主观评价  56-57
    8.3.3 客观评价  57-58
    8.3.4 歧义性分析  58-61
  8.4 本章小结  61-63
9 总结和未来工作展望  63-65
参考文献  65-71
致谢  71-72
攻读学位期间发表的学术论文  72-73
攻读学位期间参与的工作  73-76
上海交通大学学位论文答辩决议书  76

相似论文

  1. 哲学思想在指导中学数学教学中的作用,G633.6
  2. 基于本体的语义检索研究,TP391.3
  3. 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
  4. 关系数据库到RDF(S)映射方法的研究,TP311.13
  5. 普适计算下智能空间的哲学探究,N02
  6. 关键词广告商标侵权问题研究,D922.294
  7. 企业级软件组件质量保障与快速部团策略的研究,TP311.53
  8. 情景应对模式下数字化应急预案的语义模型研究,TP391.1
  9. 基于本体的方剂推荐系统模型研究与应用,TP391.3
  10. 基于插件的语义数据可视化系统及其应用,TP391.41
  11. 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
  12. 基于关系数据库的本体半自动构建方法,TP311.13
  13. 基于本体的打印机操作语义查询系统研究与实现,TP391.1
  14. 基于关系数据库的OWL本体的提取与存储研究,TP391.1
  15. 论法官判后答疑,D926.2
  16. 基于语义的Web服务匹配研究,TP393.09
  17. 基于多层QoS本体模型的个性化服务选择机制研究,TP391.1
  18. 面向学科的文献资源聚类系统研究及应用,TP391.1
  19. 基于云计算的分布式智能语义搜索方法研究,TP391.1
  20. 本体驱动的多学科协同设计知识建模方法研究,TP391.1
  21. 基于语义Web的信息检索技术研究,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com