学位论文 > 优秀研究生学位论文题录展示

基于语义web本体映射模型研究及实现

作 者: 赵忠诚
导 师: 王普;闫健卓;方丽英
学 校: 北京工业大学
专 业: 控制科学与控制工程
关键词: 语义Web 本体 本体映射 Sniper-OM
分类号: TP311.52
类 型: 硕士论文
年 份: 2010年
下 载: 104次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着万维网的发展,网络中信息资源越来越多。为了实现互联网中信息资源的共享和复用,语义Web被提出并受到了国内外研究机构的广泛关注,并且被Gartner公司列为2008-1012年10大变革性技术之一。语义Web的目的是标注信息并使计算机能够理解,使整个万维网成为一个结构严谨的知识库。本体作为语义Web核心,用于表达网络中语义信息。然而因本体建模工具和方法不同、研究者的知识结构层次不同、以及研究领域差异的影响,导致了本体异构性的产生,影响了语义Web的进一步向前发展,本体映射技术应运而生。本文在简单介绍了本体映射的现状和研究意义之后,对本体映射原型系统以及使用技术方法进行对比和分析,借鉴OLA映射系统提出Sniper-OM本体映射框架。Sniper-OM从实体名称、描述信息等元素级和本体内容数据层次关系的结构级两方面进行讨论和研究。Sniper-OM较之其他系统有如下特点:(1)使用外部词典WordNet,考虑“PART-OF”对最短路径影响,考虑多路径对相似度影响;(2)基于实例计算相似度,提出一种判断簇内样本纯度的衡量算法;(3)考虑不同边权重值,利用图匹配策略生成本体匹配图计算相似度。元素级主要考虑概念信息对相似度的影响,提出了基于外部词典WordNet的OHIIC算法和基于文本向量的CV算法。OHIIC使用了WordNet层次结构信息,寻找最短路径时在传统方法对“IS-A”关系利用基础上,还利用了“PART-OF”关系搜寻两概念的最短路径;同时OHIIC还考虑多路径对相似度影响。解析概念以及与之关联概念的所有标注信息,生成文本向量,利用改进的TF/IDF计算相似度。最后取OHIIC和CV计算结果的最大值作为两实体的相似度值。结构级主要考虑本体图结构对相似度的影响,除通常方法利用类、属性和层次信息之外,还考虑到实例存在属性结构信息,对概念实例相似度计算方法进行研究,提出一种判断簇内样本纯度的衡量标准——信息熵纯度,通过对聚类形成簇的信息熵纯度分析本体拥有实例集合的概念相似度。实验表明,这种本体映射方法表现出很高的性能。另外考虑本体的关系影响,对不同类型关系引入不同权重生成本体描述矩阵,引入图理论算法生成本体匹配图(MGO)。在前述研究基础上,本文实现了Sniper-OM原型系统,并使用OAEI 2008测试集测试该系统性能,从召回率、准确率和F-Measure3方面与其他15个映射系统实验对比,结果表明Sniper-OM系统排在第四位,强于OLA映射系统,表明该系统综合考虑类、属性和实例计算方法强于OLA单一的使用编辑距离方法。由于多策略合并方法比较简单,以及基于结构相似度关系权重值设置需要更多人为参与,该方法次于Lily、ASMOV、RiMOM映射系统。最后对研究工作进行总结和展望。本文的研究对本体映射技术的发展有一定的意义。寻找最短路径考虑“PART-OF”关系,基于实例计算相似度方法,以及利用图理论计算结构相似度对本体映射有一定的借鉴意义。映射原型的实现对本研究小组今后的进一步研究工作有一定的帮助。

全文目录


摘要  4-6
ABSTRACT  6-10
第1章 绪论  10-18
  1.1 课题研究背景  10
  1.2 课题研究目的和意义  10-11
  1.3 语义网相关研究  11-16
    1.3.1 语义Web  11-13
    1.3.2 本体(Ontology)  13-16
  1.4 本文主要内容和特点  16-17
  1.5 本文的组织结构  17-18
第2章 SNIPER-OM映射框架  18-34
  2.1 本体映射技术介绍  18-20
  2.2 本体映射方法介绍  20-21
  2.3 本体映射原型系统对比分析  21-24
  2.4 SNIPER-OM映射框架  24-32
    2.4.1 本体描述  25-27
    2.4.2 本体映射描述  27-28
    2.4.3 映射模型框架  28-32
  2.5 小结  32-34
第3章 基于概念相似度映射研究  34-48
  3.1 概念名称相似度计算  34-35
  3.2 基于外部词典  35-42
    3.2.1 OHIIC方法特点及规则  35-36
    3.2.2 OHIIC相关定义  36
    3.2.3 基于最短距离  36-40
    3.2.4 语义层次信息对相似度影响  40
    3.2.5 语义信息和语法综合计算  40-42
  3.3 基于文本向量  42-43
  3.4 综合计算  43-44
  3.5 实验及分析  44-47
  3.6 本章小结  47-48
第4章 基于本体图结构相似度映射研究  48-62
  4.1 上下位关系相似度  49-50
  4.2 属性相似度  50-52
  4.3 类结构相似度  52-54
  4.4 实例相似度  54-57
  4.5 生成匹配图(MGO)  57-59
  4.6 实验及分析  59-61
  4.7 小结  61-62
第5章 SNIPER-OM系统实现及实验分析  62-74
  5.1 系统总体框架  62-63
  5.2 系统功能模块设计  63-66
    5.2.1 标签图生成  63-64
    5.2.2 概念相似度模块  64-65
    5.2.3 图结构相似度模块  65-66
    5.2.4 相似度合并策略  66
  5.3 实验结果  66-73
  5.4 小结  73-74
结论和展望  74-76
参考文献  76-80
攻读硕士学位期间所发表的学术论文  80-82
致谢  82

相似论文

  1. 哲学思想在指导中学数学教学中的作用,G633.6
  2. 面向业务过程的服务动态组合方法研究,TP393.09
  3. 基于本体的语义检索研究,TP391.3
  4. 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
  5. WordNet和《中国分类主题词表》的映射研究,G254
  6. 企业级软件组件质量保障与快速部团策略的研究,TP311.53
  7. 基于自然语言打印机人机交互方法研究与实现,TP11
  8. 基于关系数据库的本体半自动构建方法,TP311.13
  9. 对马克思主义的唯物主义的一种重释,A811
  10. 本体驱动的多学科协同设计知识建模方法研究,TP391.1
  11. 基于RFID的离散车间物流信息语义集成技术研究,TP391.1
  12. 基于《计算机组成原理》课程本体学习研究及实现,TP391.1
  13. 客户需求驱动下机电产品维护方法及知识表达研究,F426.4
  14. 连续本体法PMMA树脂聚合工艺,TQ320.61
  15. 米约双钢琴作品《胆小鬼》本体分析与演奏技术研究,J624.1
  16. 一种面向.NET平台的OWL解析器的设计与实现,TP311.10
  17. 基于本体的智能答疑系统研究与实现,TP311.52
  18. 旅游本体知识库的构建及推理应用研究,TP391.1
  19. 优化本体的迁移学习方法研究,TP391.1
  20. 企业关系挖掘技术研究,TP391.1
  21. 面向协同设计的本体建模与集成技术研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com