学位论文 > 优秀研究生学位论文题录展示
基于XML的异构数据源集成系统研究与应用
作 者: 吕行
导 师: 周晓峰
学 校: 河海大学
专 业: 计算机应用技术
关键词: 异构数据集成 公共数据模型 查询分解 XML XML Schema
分类号: TP311.52
类 型: 硕士论文
年 份: 2004年
下 载: 313次
引 用: 9次
阅 读: 论文下载
内容摘要
随着计算机网络的普及和网络上数据信息的迅猛增加,数据资源的共享已经成为一个必然的需要,而异构数据源集成系统的作用是提供一个访问异构数据源的统一查询应用平台,使开发人员不必考虑数据模型的异构性、数据抽取、数据合成等问题而获得需要的数据信息。异构数据集成问题是数据库领域的经典问题,现在随着XML技术的兴起,异构数据集成再次成为了研究的热点。 XML作为一种数据描述的元语言标准,不断地被应用到各种不同领域的数据集成中去。XML的自描述性、开放性、可扩展性及平台无关性成为其作为数据模型描述语言的优势。 本文研究了异构数据集成的相关理论和技术,结合XML技术的优势,在已有集成系统技术成果的基础上,设计了一个基于XML的异构数据集成系统,即HDSISBX(Heterogeneous Data Sources Integration System Based on XML)的原型,并对其中的关键技术进行研究。主要工作如下: 1.在分析比较已有数据集成方法和体系结构特征的基础上,针对以往一些集成系统体系结构的不足,结合领域数据的特点在已有体系上进行改进,设计了一种基于XML的异构数据集成系统原型的体系结构,并给出各模块的实现策略,实现了其中的关键模块。 2.对关键技术的研究 1)主模式提取:结合XML作为数据模型描述语言的优势,给出一种基于XML schema的数据模型——XSDM(XML Schema-based Data Model)作为公共的数据模型以统一描述各数据源模式。主模式提取在统一描述各数据源模式的基础上,从各数据源中将刻画各应用主题业务的关键模式信息提取出来,建立一个由各应用主题关键模式元素组成的主模式集,该模式集综合了整个领域应用的模式信息,提供给用户作为查询领域异构数据的统一“视图”。本文分析了主模式提取过程的主要步骤,给出了主模式的构造算法,并借鉴全局模式增量维护的思想给出了主模式的维护策略。 2)查询处理:形式化描述了数据源查询执行能力,分析了基于数据源查询执行能力的查询分解过程,给出了相应算法。
|
全文目录
第一章 引言 6-10 1.1 研究背景 6 1.2 研究问题及现状 6-9 1.2.1 异构数据集成研究问题 6-7 1.2.2 研究现状 7-9 1.3 论文主要工作 9 1.4 论文组织 9-10 第二章 HDSISBX原型系统的体系结构 10-22 2.1 传统数据集成体系结构研究 10-13 2.1.1 虚拟视图法 10-13 2.1.1.1 联邦数据库系统 11-12 2.1.1.2 Mediated系统 12-13 2.1.2 物化方法 13 2.2 HDSISBX原型系统体系结构 13-18 2.2.1 HDSISBX体系结构设计依据 13-15 2.2.2 HDSISBX原型系统体系结构设计 15-18 2.3 HDSISBX原型系统的特点 18 2.4 原型系统开发工具选择 18-21 2.4.1 系统开发的编程语言 18-19 2.4.2 XML解析器选择 19-20 2.4.3 XML解析器的应用 20-21 2.5 本章小结 21-22 第三章 HDSISBX实现的关键技术研究 22-54 3.1 主模式提取 22-42 3.1.1 主模式提取过程的主要步骤 23-24 3.1.2 基于XML Schema的公共数据模型:XSDM 24-26 3.1.3 XSDM模型在预处理阶段的应用 26-30 3.1.4 形成应用主题输出模式 30 3.1.5 主模式规模的定制 30-31 3.1.6 主模式的构造 31-37 3.1.7 模式的增量维护思想 37-38 3.1.8 主模式的增量维护算法 38-42 3.2 模式管理数据库的设计 42-45 3.3 查询处理 45-53 3.3.1 查询分解 45-47 3.3.2 分布查询执行器 47-49 3.3.3 SOAP消息处理 49-50 3.3.4 包装器的设计 50-53 3.3.4.1 包装器模型结构 50-51 3.3.4.2 包装器实现的关键技术 51-53 3.4 本章小结 53-54 第四章 原型系统的应用实例分析 54-58 4.1 原型系统主模式提取的应用实例 54-56 4.2 原型系统查询处理的应用实例 56-57 4.3 本章小结 57-58 第五章 总结与展望 58-60 5.1 本文总结 58 5.2 进一步工作 58-60 参考文献 60-63 致谢 63
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- 海量多数据库集成系统的查询处理研究,TP311.13
- LXI自动测试系统集成技术研究,TP274
- 基于网络的服装款式设计系统的研究与实现,TS941.2
- 基于MDA的界面自动生成方法的研究,TP311.5
- C++代码缺陷检测系统的研究与设计,TP311.53
- 基于Web的科学计算遗留应用共享技术研究,TP393.09
- 基于XML的异构数据交换系统的设计与实现,TP311.52
- 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
- 概率XML数据上关键字检索算法的研究与实现,TP391.3
- 行政审批电子监察系统数据交换的设计与实现,TP311.52
- 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
- 保留语义约束的XML与关系数据库双向转换技术研究,TP311.13
- SOA架构在高校信息化系统中整合技术的应用,TP311.52
- 基于服务总线的模具企业信息集成系统,TP311.52
- 基于DITA的NGN核心网文档开发的设计和实现,TP311.52
- 基于FDT/DTM技术设备管理系统的研究与开发,TP311.52
- Web服务攻击分析与安全技术研究,TP393.08
- 基于Agent的旅游信息服务系统构建技术研究,TP393.09
- 佳木斯大学数据中心管理系统的设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|