学位论文 > 优秀研究生学位论文题录展示
基于语义Web的智能信息检索系统研究
作 者: 高继峰
导 师: 张志鸿
学 校: 郑州大学
专 业: 计算机软件与理论
关键词: 语义万维网 领域本体 信息检索 语义检索
分类号: TP391.3
类 型: 硕士论文
年 份: 2006年
下 载: 335次
引 用: 6次
阅 读: 论文下载
内容摘要
传统信息检索方式下,由于信息资源缺少统一的语义描述,用户难以查找到与实际需求相关的资源,难以实现信息资源的语义共享。如何使被管理信息资源具有应用程序可以理解的含义,并根据信息资源所具有的领域知识,实现信息资源的语义检索,提高数字化信息资源的利用率,这些问题是信息检索领域所面临的挑战。 语义万维网(Semantic Web)是万维网的发明人Tim Bemers-Lee倡导的下一代万维网,旨在赋予万维网上所有资源唯一的标识,并在资源之间建立起机器可处理的各类语义联系。语义万维网是对当代万维网的扩展和延伸,能够以一种明确的、形式化的方式来表示信息资源,提高异构系统之间的互操作性,促进知识共享。 本文通过对传统信息检索的基本原理、技术及工具、信息检索发展现状等方面的分析研究,结合万维网的具体特点,提出了基于语义万维网的语义信息检索体系框架,详细描述了语义信息检索系统CataSearch的设计思想和检索流程,并对系统模型的合理性进行了论证。 本文对语义信息检索系统中所涉及的若干关键技术进行了深入的分析研究,提出了有效的解决方案,为CataSearch实验系统的顺利实施奠定了良好的基础,这些关键技术主要包括:领域本体建模、目标文档的获取、语义路径分级和检索结果排序。 最后本文在理论分析的基础上,开发了基于语义网的化学信息检索实验系统CataSearch,实现了其中一些基本的功能,该系统以物理化学领域的催化剂为检索对象,构建了相应的领域本体。通过将各种信息资源向知识本体层映射和语义推理处理,可以充分发掘各资源之间蕴含的关联关系,从而在根本上解决了检索中资源对象语义信息缺乏的问题,满足用户对资源对象语义检索的需求。本系统实现了相对比较复杂的语义检索,提供了语义推理的功能。这些功能都是传统的基于关键字的检索方式所难以实现的,并在实验中验证了CataSearch系统模型的可行性。
|
全文目录
摘要 3-4 ABSTRACT 4-7 第一章 引言 7-14 1.1 问题的提出及研究意义 7-8 1.1.1 问题的提出 7 1.1.2 研究意义 7-8 1.2 国内外研究现状及分析 8-11 1.2.1 信息检索研究现状 8-10 1.2.2 问题分析 10-11 1.3 本文研究的目的和研究内容 11-12 1.3.1 研究目的 11 1.3.2 研究内容 11-12 1.4 本文的章节安排 12-14 第二章 语义网(SEMANTIC WEB)概述 14-29 2.1 引言 14-15 2.2 语义万维网的概念 15-18 2.3 语义万维网的组成 18-26 2.3.1 语义万维网体系结构 18-19 2.3.2 URI和Unicode(编码层) 19-20 2.3.3 XML、NameSpace和XML Schema(语法层) 20-21 2.3.4 RDF和RDF Schema(元数据层) 21-24 2.3.5 Ontology Vocabulary(词汇层) 24-25 2.3.6 Logic、Proof & Trust(逻辑层) 25-26 2.4 语义万维网的应用 26-28 2.5 本章小结 28-29 第三章 对本体建模方法的改进 29-39 3.1 引言 29-30 3.2 目前的本体建模方法 30 3.3 螺旋模型 30-31 3.4 基于螺旋模型的原型法建模 31-37 3.4.1 需求分析 31-32 3.4.2 制定计划 32 3.4.3 实施领域本体的建设 32-36 3.4.4 确认与评价 36 3.4.5 进化 36-37 3.5 主要的特点 37-39 第四章 文档的结构化处理和语义推理 39-54 4.1 提出问题 39-40 4.2 基于本体的检索系统原理 40-41 4.3 语义信息检索模型 41-53 4.3.1 信息资源的结构化处理 42-46 4.3.2 对用户需求的分析处理 46-50 4.3.3 查询结果处理 50-53 4.4 小结 53-54 第五章 CATASEARCH系统的实现 54-71 5.1 应用背景 54-55 5.2 CATASEARCH系统的设计 55-59 5.2.1 CataSearch的设计目标 55-56 5.2.2 CataSearch系统结构图 56-57 5.2.3 平台与环境 57-59 5.3 CATASEARCH系统原型的构造 59-67 5.3.1 本体的构造 59-62 5.3.2 RDF数据的存储 62-65 5.3.3 CataSearch系统的主要功能类 65-67 5.4 对推理和查询功能的检验分析 67-70 5.5 本章小结 70-71 第六章 结论与展望 71-74 6.1 论文总结 71-72 6.2 工作展望 72-74 参考文献 74-77 致谢 77-78 附录 78
|
相似论文
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 基于本体的语义检索研究,TP391.3
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 网络议程设置与旅游目的地形象建构研究,F592
- 服装面料信息管理技术研究,TS941.15
- 基于P2P网络的分布式军事情报检索方法与原型系统研究,G354
- 语义检索在出版社网站中的应用研究,TP391.3
- 搜索引擎中网络爬虫技术研究,TP391.3
- 军队院校原生文献检索系统的设计与实现,TP391.3
- 基于R树的空间—文本混合索引方法,P208
- 基于领域本体的Deep Web数据源聚焦技术研究,TP393.09
- 基于区域特征的有监督图像语义标注,TP391.41
- 分布式教育网信息检索系统的研究和实现,TP391.3
- 面向全文检索的在线索引关键技术研究,TP391.3
- 基于信息匹对及二维检索模式的三农信息化服务系统,TP311.52
- 基于用户兴趣模型的个性化搜索引擎研究与分析,TP391.3
- 面向海量邮件的检索系统研究与实现,TP393.098
- 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
- 基于Agent的搜索引擎的研究与实现,TP391.3
- 基于分布式多索引融合的专利信息检索研究,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|