学位论文 > 优秀研究生学位论文题录展示
面向语义正确性的集成数据访问方法研究
作 者: 唐富年
导 师: 姚莉
学 校: 国防科学技术大学
专 业: 管理科学与工程
关键词: 本体 数据语义 语义Web 关系数据库 数据访问 数据集成
分类号: TP311.13
类 型: 博士论文
年 份: 2012年
下 载: 60次
引 用: 0次
阅 读: 论文下载
内容摘要
随着数据资产的快速增长,“信息过载”问题逐渐受到人们的重视,如何从海量数据资产中访问语义正确的数据支持决策成为一大技术瓶颈。由于分布、自治的关系数据库是当前最主要的数据来源,因而充分发掘关系数据库的语义信息并提升关系数据库访问的语义正确性,成为当前人们关注的重点。为解决上述问题,本文提出了一种面向语义正确性的集成数据访问方法,对本体表达能力与推理复杂度的折衷、语义映射的半自动化构造、语义查询处理与实例检验、动态环境下集成数据访问系统的适应性维护等问题进行了深入研究,提供了一种将信息优势转化为决策优势的新思路。论文的主要研究成果包括如下几个方面:(1)考虑到实际应用对于本体的表达能力和推理复杂度的需求存在矛盾,本文提出并论证了分层TBox模型和动态ABox模型,使本体在具有较高表达能力的前提下具有更好的计算性能。随后,本文在DL-Lite系列描述逻辑子集的基础上扩展了一种新的DL-LiteNOWL描述逻辑子集,该子集能够充分描述ER模式的语义,同时又具有较好的计算复杂度特性。在上述研究基础上,本文提出了一种面向语义正确性的集成数据访问方法,给出了相应的系统架构和实现流程。(2)在建立关系数据库和本体之间的语义映射时,为了能够在提高映射构造自动化程度的同时降低查询应答的复杂度,本文采用了一种LAV+O-GAV的映射方式。其中,在LAV映射构造过程中,根据DL-LiteNOWL本体的特点提出了一种基于概念连接图的LAV映射发现方法,以半自动方式发现隐含于关系模式中的语义;而O-GAV映射的构造过程基于分层TBox和LAV映射实现,它的作用是建立本体内涵知识片段与数据库存储的外延事实之间的语义关联。采用LAV+O-GAV映射方式,能够在保持系统可扩展性的前提下降低查询处理复杂度,同时也有助于提升语义映射的构造效率。(3)基于分层TBox模型、动态ABox模型以及正确的语义映射,提出了一种面向虚拟对象的查询处理方法。该方法分为三个阶段:首先根据DL-LiteNOWL的特点和重写规则,采用SuperRef重写算法对用户查询进行扩展重写,将用户查询扩展重写为新的查询集合;其次,基于O-GAV映射和扩展重写查询集求取与第一级分层TBox(T Q)相对应的动态ABox(AQ);最后,基于伪模型方法进行实例检验,求取满足后续TBox分层中公理约束的虚拟对象集。面向虚拟对象的查询处理方法具有较为稳定的性能,能够在保证数据语义正确的前提下满足正常数据访问对效率的需求。(4)为了能够使集成数据访问方法适用于动态环境,本文还给出了一种基于面向分层TBox的本体演化方法——LTOOE方法,该方法能够在本体演化中保持TBox的分层不变,并且对分层TBox的第一级分层影响最小。由于本体变化传播之后可能造成映射失效,本文还探讨了LAV映射的合法性检测方法和有效性检测方法,并且借助LAV映射可视化手段给出了一种增量式映射维护方法。本文的研究成果对于数据集成与访问、智能决策支持和语义Web等领域具有积极意义,能够确保为用户或智能应用提供语义正确的数据。同时,也为关系数据库数据语义的发掘和利用找到了一种可行的思路。
|
全文目录
摘要 11-13 Abstract 13-15 第一章 绪论 15-35 1.1 研究背景 15-20 1.1.1 基于本体的集成数据访问 16-17 1.1.2 问题的提出 17-20 1.2 研究现状及发展趋势 20-31 1.2.1 面向术语级语义的数据访问 20-21 1.2.2 面向模式级语义的数据访问 21-24 1.2.3 支持数据访问的描述逻辑子集与 DL 推理机 24-26 1.2.4 关系数据库模式到本体的映射 26-30 1.2.5 研究现状总结与分析 30-31 1.3 研究思路 31-33 1.3.1 本文的研究内容 31-32 1.3.2 主要创新点 32-33 1.4 论文的组织结构 33-35 第二章 面向语义正确性的集成数据访问方法 35-64 2.1 理论基础与基本定义 35-43 2.1.1 基本假设与研究条件 35-38 2.1.2 面向语义正确性的集成数据访问基本思想 38-39 2.1.3 集成数据访问相关的形式定义 39-43 2.2 面向集成数据访问的分层 TBox 模型 43-53 2.2.1 分层 TBox 模型的基本思想 43-45 2.2.2 DL-LiteNOWL描述逻辑子集及其构造子 45-51 2.2.3 基于DL-LiteNOWL描述逻辑进行 TBox 分层 51-53 2.3 面向集成数据访问的动态 ABox 模型 53-58 2.3.1 动态 ABox 模型的基本思想 54-55 2.3.2 面向虚拟对象的数据访问处理 55-57 2.3.3 LAV+O-GAV 形式的语义映射 57-58 2.4 面向语义正确性的集成数据访问框架及其实现 58-62 2.4.1 SCIDA 系统及其架构 58-60 2.4.2 SCIDA 方法的实现过程 60-62 2.5 相关研究 62 2.6 小结 62-64 第三章 支持集成数据访问的语义映射构造方法研究 64-100 3.1 语义映射构造的理论基础及其流程 64-68 3.1.1 LAV+O-GAV 映射方式的基本原理 64-66 3.1.2 基本的形式定义 66-68 3.2 关系数据库模式蕴含的语义 68-76 3.2.1 强实体集与弱实体集的语义 70-72 3.2.2 二元联系集的语义 72-74 3.2.3 多元联系集的语义 74-75 3.2.4 多值属性与概化关系的语义 75-76 3.3 基于概念连接图的 LAV 映射发现算法 76-90 3.3.1 使用DL-LiteNOWL本体描述关系表的语义 76-78 3.3.2 LAV 映射构造的基本流程 78-80 3.3.3 实体树的构造 80-82 3.3.4 基于概念连接图的映射发现 82-86 3.3.5 算法分析与正确性证明 86-87 3.3.6 实验验证 87-90 3.4 O-GAV 映射的自动构造 90-98 3.4.1 O-GAV 映射构造的原理 91-93 3.4.2 O-GAV 映射构造算法 93-94 3.4.3 虚拟对象信息的合并问题 94-96 3.4.4 算法的正确性 96-97 3.4.5 映射工作节省率评估 97-98 3.5 相关研究 98-99 3.6 本章小结 99-100 第四章 基于虚拟对象的语义查询处理方法研究 100-128 4.1 基于虚拟对象的语义查询处理问题 100-106 4.1.1 常规集成系统中的查询处理 100-102 4.1.2 基于虚拟对象的语义查询及其流程 102-103 4.1.3 SmartQuery 查询语言及语义查询的基本形式 103-106 4.2 语义查询的扩展重写算法 106-114 4.2.1 扩展重写的目的和作用 106-108 4.2.2 扩展重写规则集 108-109 4.2.3 SuperRef 扩展重写算法 109-113 4.2.4 算法分析及其正确性 113-114 4.3 基于动态 ABox 的查询应答与实例检验 114-124 4.3.1 虚拟对象获取与动态 ABox 的构造 114-119 4.3.2 基于伪模型的实例检测 119-124 4.3.3 查询应答的语义正确性 124 4.4 实验验证与评估 124-127 4.4.1 查询扩展重写实验验证 124-125 4.4.2 数据访问整体效能评估 125-127 4.5 本章小结 127-128 第五章 本体演化条件下集成数据访问系统的维护方法研究 128-146 5.1 本体演化条件下 SCIDA 系统的适应性维护框架 128-132 5.1.1 六阶段维护框架 128-131 5.1.2 基本定义 131-132 5.2 LTOOE 本体演化方法 132-136 5.2.1 适用于分层 TBox 的本体演化策略 132-134 5.2.2 LTOOE 算法流程 134-136 5.3 语义映射的失效检测方法 136-141 5.3.1 语义映射的基本性质 136-137 5.3.2 映射的合法性检测 137-138 5.3.3 映射的有效性检测 138-141 5.4 语义映射维护方法 141-145 5.4.1 映射的可视化 141-143 5.4.2 映射的增量式维护 143-145 5.5 本章小结 145-146 第六章 结论与展望 146-149 6.1 论文研究总结 146-147 6.2 下一步工作 147-149 致谢 149-150 参考文献 150-161 作者在学期间取得的学术成果 161-163 附录 A 本文用到的示例关系数据库模式 163-164 附录 B 本文中用到的示例本体 Conference 164-165 附录 C SmartQuery 语言及其语法定义 165-167 附录 D 使用 SmartQuery 语言改写后的基准测试查询集 167-168 附录 E LAV 映射测试集 168
|
相似论文
- SOA高校迎新系统中的SDO模型的研究与实现,G647
- 哲学思想在指导中学数学教学中的作用,G633.6
- 面向业务过程的服务动态组合方法研究,TP393.09
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- 俄语外来词的本土化及其深层解读,H35
- 网格环境下城市三维空间数据的集成访问与互操作,P208
- 基于关系数据库理论的面向对象数据库系统应用研究,TP311.52
- RDF/RDFS到关系数据库模式映射方法的研究,TP311.13
- 基于本体的果树病虫害知识表示与推理的研究,S126
- 面向关系数据库的数字水印技术研究,TP309.7
- 基于语义Wiki的集成过程知识协同技术研究,TP311.52
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 基于语义的Web服务发现研究,TP393.09
- 情境感知的Web信息自适应个性化服务研究,G252
- 基于模糊矩阵评判模型的教学质量评价系统设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|