学位论文 > 优秀研究生学位论文题录展示
基于本体的语义信息检索研究
作 者: 王进
导 师: 王煦法;陈恩红
学 校: 中国科学技术大学
专 业: 计算机应用技术
关键词: 本体 语义信息检索 查询语义扩展 语义聚类 频繁语义序列
分类号: TP391.3
类 型: 博士论文
年 份: 2006年
下 载: 2923次
引 用: 69次
阅 读: 论文下载
内容摘要
随着Internet的爆炸性增长,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大动态信息服务网络,为用户提供了一个极具价值的信息源。而传统的信息检索技术不能对这些信息提供语义级的组织、理解以及处理等更能满足用户需求的服务,寻找新的方法成为目前研究的热点。 在现有语义检索方法的基础上,本文针对基于本体的语义信息检索进行了深入的研究,以本体为依据,提出了一种新的语义检索模型,并对该模型涉及的用户查询、文档预处理、语义检索以及检索结果优化等方面,从系统的角度对其中的主要问题进行了分析和研究,主要贡献有: 1.提出了一种基于本体的查询语义扩展方法。 针对现有查询扩展策略缺乏有效的语义处理机制问题,在深入分析现有基于本体概念的查询扩展策略基础上,提出了三种用户查询的语义模式,以及相应的用户查询扩展的方法。该方法利用本体概念连通图以及单词的概念扩展算法对用户查询进行语义扩展,为基于语义的信息检索提供了新的思路。 2.提出了一种基于本体的文档语义标注和语义聚类方法。 针对语义检索中文档表示问题以及文档聚类的语义质心划分问题,提出了一种对文档进行语义标注和向量化处理,以及利用概念连通图中的节点权重进行语义聚类质心划分的方法。该方法在对文档进行语义预处理,并利用文档的实例抽取分析进行语义标注的基础上,为文档建立语义特征向量,并以此为依据对文档进行语义聚类,为文档的组织提供了有效的语义级管理手段。 3.提出了一种基于本体的语义信息检索模型。 针对传统向量空间模型在语义处理方面的缺陷,提出了一种基于本体的语义信启、检索模型,从语义项权重的设计、不同关键字之间的语义关系体现,以及语义特征向量间的相似度计算策略等方面进行了研究。在模型中,通过概念连通图对不同语义项之间的关系进行了重新考量,并将语义相似度的计算分为概念相似度和属性相似度两个方面,综合考虑了二者在语义检索中的作用,改善了检索效果。 4.设计了一种基于频繁语义序列模式挖掘的检索结果优化方法。
|
全文目录
摘要 3-5 Abstract 5-7 目录 7-10 第一章 前言 10-36 1.1 信息检索概述 11-17 1.1.1 传统信息检索基本原理 12-13 1.1.2 信息检索模型 13-16 1.1.3 信息检索系统 16-17 1.2 信息的语义表示 17-22 1.2.1 元数据和信息表示 17-18 1.2.2 资源描述框架及模式RDF(S) 18-20 1.2.3 基于本体的信息表示 20-22 1.3 基于语义的信息检索 22-29 1.3.1 语义信息检索研究现状 22-27 1.3.2 研究的内容及创新 27-29 1.4 论文结构 29-30 参考文献 30-36 第二章 用户查询的语义扩展 36-54 2.1 查询扩展概述 36-37 2.2 查询扩展方法分析 37-40 2.2.1 基于全局和局部分析的查询扩展 37-38 2.2.2 基于词表的查询扩展 38-39 2.2.3 基于语义的查询扩展 39-40 2.3 基于本体的语义查询扩展 40-49 2.3.1 语义查询扩展分析 40-41 2.3.2 基于本体的用户查询分析 41-43 2.3.3 用户查询的语义向量 43-45 2.3.4 用户查询语义扩展算法 45-49 2.4 实验分析 49-50 2.5 本章小结 50-51 参考文献 51-54 第三章 文档的语义预处理 54-78 3.1 基于本体的语义标注 55-62 3.1.1 概述 55-57 3.1.2 基于本体的语义标注分析 57-59 3.1.3 语义标注的流程 59-60 3.1.4 语义实例的标注和抽取 60-62 3.2 文档的语义表示 62-64 3.2.1 文档语义特征向量 62-63 3.2.2 文档语义向量索引 63-64 3.3 基于本体的文档语义聚类 64-72 3.3.1 基于本体的k-平均聚类 65-67 3.3.2 语义聚类的质心划分 67-70 3.3.3 基于语义质心的文档聚类 70-72 3.4 实验分析 72-75 3.5 本章小结 75 参考文献 75-78 第四章 基于本体的语义向量空间检索 78-100 4.1 传统模型与语义模型的比较 79-82 4.1.1 向量空间 79-80 4.1.2 项的权重 80-81 4.1.3 相似度 81-82 4.2 本体的语义 82-88 4.2.1 本体的结构 82-84 4.2.2 本体的逻辑推理 84-86 4.2.3 语义检索的逻辑推理 86-88 4.3 语义相似度的计算 88-92 4.3.1 概念相似度 88-91 4.3.2 属性相似度 91 4.3.3 语义相似度 91-92 4.4 实验分析 92-96 4.5 本章小结 96 参考文献 96-100 第五章 面向序列模式挖掘的语义检索优化 100-118 5.1 频繁序列模式 101-103 5.1.1 基本概念 101-103 5.1.2 序列模式挖掘 103 5.2 频繁语义序列模式 103-108 5.2.1 文档的语义序列分析 104-105 5.2.2 语义序列模式挖掘方法描述 105-108 5.3 基于频繁语义序列的检索结果优化 108-111 5.3.1 用户语义焦点 108-110 5.3.2 语义检索优化 110-111 5.4 实验分析 111-113 5.5 本章小结 113-114 参考文献 114-118 第六章 面向新闻的语义信息检索系统 118-126 6.1 系统结构 118-119 6.2 查询扩展模块 119-120 6.3 文档预处理模块 120-121 6.4 语义检索模块 121-122 6.5 检索结果优化模块 122 6.6 系统演示界面 122-125 6.7 本章小结 125-126 第七章 总结 126-129 7.1 本文主要工作 126-127 7.2 本文的主要贡献和创新点 127-128 7.3 后续的主要工作 128-129 在读期间发表的论文 129-130 在读期间参加的项目 130-131 致谢 131
|
相似论文
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 220kV输电线路除冰机器人机械本体研究,TP242
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 基于语义的Web服务发现研究,TP393.09
- 本体在智能小区中的应用研究,TP391.1
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 数据空间中数据资源之间关联关系发现模型研究,TP311.13
- 普适计算下智能空间的哲学探究,N02
- 企业级软件组件质量保障与快速部团策略的研究,TP311.53
- 基于PLSA语义聚类的web服务发现方法,TP393.09
- 情景应对模式下数字化应急预案的语义模型研究,TP391.1
- 一种基于语义的建筑工程质量检测方法研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|