学位论文 > 优秀研究生学位论文题录展示
基于本体的知识表示及信息检索研究
作 者: 李丹丹
导 师: 黄文培
学 校: 西南交通大学
专 业: 教育技术学
关键词: 计算机领域本体 本体 知识表示 信息检索 本体构建
分类号: G354.4
类 型: 硕士论文
年 份: 2011年
下 载: 162次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络信息的快速增长,基于关键词的传统信息检索技术已逐渐不能满足人们的需求。而知识检索注重知识和语义的匹配,具有较高的查准率和查全率,成为了人工智能领域及信息检索领域的研究热点。本体良好的概念层次结构恰好适合知识表示,可以充分描述领域知识模型,反映概念间的语义关系,且支持逻辑推理,因而基于本体的知识检索可以更好的实现语义检索及提高检索准确度。本文在对本体的知识表示、本体描述语言、编辑工具及建模方法的深入分析及比较的基础上,设计了计算机科学与技术领域本体的构建过程,依次获取计算机领域本体的知识表示元素:概念、继承关系、属性关系、实例等,对每个步骤中所涉及的算法与技术进行了分析与实现。主要包括:首先在ICTCLAS开源系统基础上二次开发实现批量语料的分词与去除无用词的预处理;其次采用特征词权重计算算法TF-IDF实现了对计算机领域语料库的特征词提取,从而获得计算机领域候选概念集;然后通过计算概念间的相关度构建概念向量,并采用夹角余弦公式计算概念间的相似度,经过人工聚类获得计算机领域继承关系的知识层次结构;最后基于概念继承关系,获取概念与概念间的对象属性、概念的数据属性及属性的限制。完成了以上领域本体知识元素的获取后,采用protege构建了计算机领域本体并进行评价。基于计算机领域本体,本文探讨了基于本体的信息检索关键技术。首先分析比较了数据检索、全文检索与知识检索技术的检索特点,指出基于本体的知识检索的优势。其次在本体的通用推理规则和本体典型关系的推理规则的基础上构建了计算机领域本体的一系列领域推理规则,为知识检索系统的推理功能提供支持。最后基于本体提出了一种启发式的查询式扩展算法和流程,以保证信息检索的查全率。最后在理论技术研究的基础之上,设计并实现了基于计算机领域本体的论文检索系统实验原型。系统提供了条件检索和导航检索两种检索方式,系统具有良好的语义推理及查询式扩展功能,同时也验证了本文理论技术的正确性。
|
全文目录
摘要 6-7 Abstract 7-11 第1章 绪论 11-15 1.1 课题研究背景及意义 11-12 1.1.1 研究背景 11-12 1.1.2 研究意义 12 1.2 国内外研究现状 12-13 1.3 本文研究工作与成果 13-15 第2章 论文研究理论基础 15-24 2.1 传统的领域知识表示方式 15-16 2.2 本体及其知识表示 16-23 2.2.1 本体的概念及分类 16-17 2.2.2 本体描述语言 17-19 2.2.3 本体编辑工具 19-21 2.2.4 本体构建规则及方法 21-23 2.3 本章小结 23-24 第3章 计算机领域本体构建技术的研究 24-44 3.1 计算机领域本体构建流程设计 24-25 3.2 语料库的获取及预处理 25-29 3.2.1 计算机领域语料库的获取 26 3.2.2 计算机领域语料库预处理 26-29 3.3 计算机领域概念获取 29-32 3.3.1 特征词权重算法分析与选择 29-30 3.3.2 TF-IDF算法实现 30-32 3.4 计算机领域继承关系的获取 32-38 3.4.1 基于相关度的概念向量模型建立 33-34 3.4.2 基于概念向量模型的相似度计算 34-35 3.4.3 计算机领域概念继承关系获取案例分析 35-38 3.5 计算机领域本体属性的获取 38-39 3.6 计算机领域本体的表示 39-41 3.7 计算机领域本体的评价及进化 41-42 3.8 本章小结 42-44 第4章 基于本体的信息检索关键技术研究 44-54 4.1 三种信息检索技术的分析与比较 44-46 4.2 领域推理规则的建立 46-51 4.3 查询式扩展算法设计 51-53 4.4 本章小结 53-54 第5章 计算机论文检索系统设计与实现 54-71 5.1 系统开发环境和工具 54-55 5.2 论文检索系统需求分析 55 5.3 论文检索系统流程分析 55-56 5.4 系统总体架构 56-57 5.5 系统功能模块设计 57-58 5.6 文献索引本体库设计 58-62 5.7 系统主要功能模块实现 62-68 5.7.1 本体管理模块 62-64 5.7.2 查询式扩展模块 64-65 5.7.3 论文检索模块 65-68 5.8 论文检索系统功能验证 68-70 5.8.1 条件检索功能验证 68-69 5.8.2 导航检索功能验证 69-70 5.9 本章小结 70-71 结论与展望 71-73 致谢 73-74 参考文献 74-77 攻读硕士学位期间发表的论文 77
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 面向海量邮件的检索系统研究与实现,TP393.098
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 220kV输电线路除冰机器人机械本体研究,TP242
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 基于语义的Web服务发现研究,TP393.09
- 本体在智能小区中的应用研究,TP391.1
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 数据空间中数据资源之间关联关系发现模型研究,TP311.13
- 普适计算下智能空间的哲学探究,N02
- CBR-RBR模式在地铁施工安全事故案例库中的应用,U215.8
中图分类: > 文化、科学、教育、体育 > 科学、科学研究 > 情报学、情报工作 > 情报检索 > 计算机情报检索系统
© 2012 www.xueweilunwen.com
|