学位论文 > 优秀研究生学位论文题录展示

领域本体的构建及其在信息检索中的应用研究

作 者: 郭嘉琦
导 师: 刘辰
学 校: 北京邮电大学
专 业: 计算机科学与技术
关键词: 领域本体 信息检索模型 语义相似度
分类号: TP391.3
类 型: 硕士论文
年 份: 2007年
下 载: 579次
引 用: 17次
阅 读: 论文下载
 

内容摘要


作为北京邮电大学智能通信软件与多媒体北京市重点实验室科研项目——“基于Globus的分布式推理机研究”的前期工作,本文着重研究了领域本体的构建及其在信息检索中的应用。随着网络信息的急增,信息检索工具将扮演着越发重要的角色。借助于信息检索工具,人们可以快速、准确地查找到所需的信息。查全率和查准率是衡量信息检索工具的重要标准,目前基于关键字的信息检索在查全率和查准率方面都有待提高。一方面,检索工具会返回大量无关的链接;另一方面,相当多的有效信息被检索工具遗漏了。为此,应该把信息检索从基于关键词的层次提高到基于概念的层次,同时应该对概念的相关性进行挖掘。而基于领域本体的语义检索正是实现这种提高的关键所在。本文获得的主要研究成果有:(1)针对已有本体建模方法的局限性,借鉴软件工程学中基于软件生命周期的建模理论,建立了电影本体的结构模型。提出了一种新的基于平面螺旋关系的本体知识存储机制,以降低查询构造的复杂度,提高查询扩展的效率。(2)设计了基于电影领域本体的智能信息检索模型的三层体系结构,实现了查询生成,查询优化,匹配服务,检索结果序列优化等功能模块。(3)提出了一种新的基于查询表达式与关系表互为映射的查询提炼算法,使得自然语言查询处理过程中避免引入复杂的分词环节,能够识别查询语句中的核心概念,有效地提高了查询效率。(4)建立了基于本体的电影领域信息检索原型系统,充分利用本体在知识重用和共享上的优势,帮助用户从领域知识库中高效地获取专业信息。(5)根据检索的结果与检索词的关联程度,提出一种新的基于本体加权语义树的相似度算法,使得检索的结果文档按照语义相关性从高到低排列。

全文目录


摘要  4-6
ABSTRACT  6-8
目录  8-10
第一章 绪论  10-16
  1.1 信息检索  10-13
    1.1.1 信息检索概述  10-11
    1.1.2 信息检索存在的问题  11-12
    1.1.3 智能信息检索技术  12-13
  1.2 领域检索现状分析  13-14
    1.2.1 领域检索国内外相关研究  13-14
    1.2.2 领域检索现状分析  14
  1.3 本文主要内容和意义  14-16
    1.3.1 本文研究的目标和内容  14-15
    1.3.2 本文研究的意义  15
    1.3.3 本文结构安排  15-16
第二章 本体理论概述  16-28
  2.1 语义网基础  16-19
    2.1.1 语义网技术架构  16-18
    2.1.2 概念间的语义关系  18-19
  2.2 本体论  19-22
    2.2.1 本体的概念  19
    2.2.2 本体的分类  19-20
    2.2.3 本体的功能  20-21
    2.2.4 基于本体的信息检索  21-22
  2.3 领域本体构建原则  22
  2.4 本体描述语言  22-23
  2.5 本体编写工具  23-24
  2.6 本体建模方法  24-28
第三章 领域本体的构建研究  28-37
  3.1 电影领域本体构建方法论  28-30
    3.1.1 领域本体构建过程中存在的问题  28
    3.1.2 基于本体生命周期的方法  28-30
  3.2 需求分析与制定计划  30
  3.3 实施电影本体的建设  30-35
    3.3.1 领域信息的收集和分析  30-31
    3.3.2 重点概念和关系的确立  31-33
    3.3.3 利用Protégé构建本体  33-34
    3.3.4 本体实例添加  34-35
  3.4 本体的评价与演化  35-36
  3.5 电影本体存储方法  36-37
    3.5.1 已有本体存储方法  36
    3.5.2 基于平面螺旋关系的本体存储  36-37
第四章 基于本体的电影领域信息检索  37-48
  4.1 领域本体知识检索过程分析  37-38
  4.2 电影本体智能检索模型  38-43
    4.2.1 模型体系结构  38-40
    4.2.2 本体引导的查询生成  40-41
    4.2.3 基于本体的查询提炼  41-42
    4.2.4 本体查询算法  42-43
  4.3 基于电影本体的智能检索原型系统  43-48
    4.3.1 系统概述  43-44
    4.3.2 MOIRS总体结构  44-45
    4.3.3 系统功能模块描述  45-48
第五章 领域本体的相似度计算与系统评价  48-56
  5.1 传统相似度算法  48-50
    5.1.1 布尔模型相似度  48-49
    5.1.2 向量空间模型相似度  49-50
  5.2 基于本体加权语义树的相似度算法  50-53
    5.2.1 本体加权语义树的构造  50-51
    5.2.2 OWSTS算法的实现  51-53
  5.3 电影本体智能检索系统评价  53-56
    5.3.1 评价性能指标  53
    5.3.2 试验分析与系统评价  53-56
第六章 结束语  56-58
  6.1 研究工作总结  56-57
  6.2 后续工作  57-58
参考文献  58-60
致谢  60

相似论文

  1. 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
  2. Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
  3. 基于领域本体的海洋环境数据仓库设计,TP311.13
  4. 数据空间中数据资源之间关联关系发现模型研究,TP311.13
  5. 基于链接重要性的动态链接预测算法研究,TP393.03
  6. 基于本体的智能电网知识检索系统,TM76
  7. 基于中文维基百科的语义相关度计算的研究与实现,TP391.1
  8. 面向学科的文献资源聚类系统研究及应用,TP391.1
  9. 基于接口匹配的语义Web服务发现方法研究,TP391.1
  10. 基于领域本体的网络产品检索引擎的研究与实现,TP391.3
  11. 基于分层需求的领域本体构建及语义标注方法研究,TP391.1
  12. 业务服务的语义描述及标注技术研究,TP311.52
  13. 基于内容的视频语义提取软件研究及应用,TP391.41
  14. 基于领域本体的课件自动生成的研究,TP317.4
  15. 基于本体的知识表示及信息检索研究,G354.4
  16. 基于领域本体扩展查询的文本信息检索研究,TP391.3
  17. 基于领域本体的Deep Web数据源聚焦技术研究,TP393.09
  18. 基于本体及概念模式的Deep Web查询结果处理技术,TP393.09
  19. 基于领域本体的Deep Web不确定性模式匹配研究,TP393.09
  20. 基于领域本体Web信息采集的研究,TP393.09
  21. 基于领域本体的语义检索系统研究,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com