学位论文 > 优秀研究生学位论文题录展示
基于模式映射的XML与关系数据库的存储技术的研究
作 者: 刘作虎
导 师: 黄明和;汪浩
学 校: 江西师范大学
专 业: 计算机应用技术
关键词: S_Schema XML 关系存储 模式映射 XML Schema
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 62次
引 用: 2次
阅 读: 论文下载
内容摘要
近几年来,随着互联网的不断迅速发展,XML正迅速取代HTML成为Web上数据表示、集成和交换的标准,越来越受到人们的青睐,然而,随着互联网上发布的XML数据的不断增加,如何有效管理XML文档已成为一个十分棘手的问题。而目前最主要的数据存储方式是关系数据库,人们很自然地希望利用现有关系数据库的丰富资源和管理经验来存储XML文档,将半结构化数据转化为结构化的数据。然而由于XML数据和关系型数据在组织上的差异,从XML文档到关系数据库转换过程中存在的XML文档多值元素、递归元素以及混合内容元素的映射等难点问题一直没有得到有效的解决,主要表现为映射方法不灵活,查询效率低,丢失有用信息等,这增加了系统的开销、复杂性,影响了数据库的效率。与此同时,不同的生产厂商生产的数据库是异质的,这必然会增加开发基于XML的Internet应用的难度,不但如此,现存的方法大多数以DTD来定义XML文档模式,但是DTD缺乏对数据类型、文档结构、属性等约束的足够描述,而且对于XML的名字空间处理、扩展性、管理等方面有着完全不同的格式,因此,采用DTD作为模式的映射方法不容易实现XML文档的自动化存储和查询。另一方面,W3C组织于2001年5月正式推荐了XML Schema为XML的标准模式,XML Schema的格式与XML的格式完全相同,而且提供了更多的内建数据类型,并支持用户对数据类型的扩展,基本上满足了关系模式在数据描述上的需要。所以,XML Schema比DTD具有更强大的表达能力,更能适应不同领域的需求,更适合描述关系数据,有代替DTD的趋势。于是人们很自然的会考虑到如果可以把XML Schema模式转换成关系数据库模式,那么符合XML Schema格式的XML文档就能很容易地转换成关系数据库中的数据了。基于上述考虑,本文在介绍XML语言及相关知识、XML存储技术的基础上,根据W3C最新提出的XML Schema规范,提出了一种等价于XML Schema的数据模型S_Schema,并实现了从S_Schema到关系模式的映射算法和Xml文档到关系数据库的加载算法。通过实验可以证明,在XML文档的模式信息相对稳定的情况下,本文所提出的S_Schema映射方法在信息保持、查询效率、灵活性等方面均要优于DTD、文本和Xparent等方法。根据本文提出的思想,S_Schema方法能够很好地实现XML文档查询和存储的自动化。
|
全文目录
摘要 3-4 Abstract 4-8 第一章 绪论 8-12 1.1 研究背景及意义 8 1.2 国内外研究的现状 8-10 1.3 研究内容及创新点 10-11 1.4 本文组织结构 11-12 第二章 XML 及其模式语言介绍 12-26 2.1 XML 简介 12-15 2.1.1 XML 的产生背景 12-13 2.1.2 XML 的优缺点 13-14 2.1.3 XML 的相关应用及使用前景 14-15 2.2 XML 的文档格式 15-17 2.2.1 XML 的语法 15-16 2.2.2 XML 的名称空间 16-17 2.3 XML 语言的相关规范 17-21 2.3.1 应用编程接口DOM 和SAX 18 2.3.2 XSL(XML StylesSheet Language) 18-19 2.3.3 Xquery 19-20 2.3.4 XML 链接规范 20-21 2.4 XML 模式 21-25 2.4.1 DTD 简介 21-22 2.4.2 XML Schema 简介 22-24 2.4.3 XML Schema 与XML DTD 的比较分析 24-25 2.5 本章总结 25-26 第三章 XML 存储技术 26-39 3.1 基于文件系统的存储 26 3.2 XML 原生数据库 26-27 3.3 XML 在面向对象数据库中的存储 27-28 3.4 XML 在关系数据库中的存储 28-37 3.4.1 模型映射方法 28-34 3.4.2 结构映射方法 34-37 3.5 本章总结 37-39 第四章 S_Schema(Standard XML Schema)模型 39-56 4.1 S_Schema 设计的基本思想 39-40 4.2 S_Schema 生成 40-44 4.2.1 S_Schema 的结构 41-42 4.2.2 S_Schema 的生成算法 42-44 4.3 关系模式的生成 44-47 4.3.1 S_Schema 的DOM 树表示 44-45 4.3.2 S_Schema 到关系模式的生成算法 45-47 4.4 加载 XMl 文档到数据库 47-49 4.5 实验结果及分析讨论 49-55 4.5.1 S_Schema 方法的文档可恢复性 49-50 4.5.2 S_Schema 方法和其他方法的比较 50-52 4.5.3 S_Schema 的改写及讨论 52-55 4.6 本章总结 55-56 第五章 总结与展望 56-58 5.1 总结 56-57 5.2 展望 57-58 参考文献 58-61 致谢 61-62 读硕士研究生期间发表的论文 62
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- 海量多数据库集成系统的查询处理研究,TP311.13
- LXI自动测试系统集成技术研究,TP274
- 基于网络的服装款式设计系统的研究与实现,TS941.2
- 基于MDA的界面自动生成方法的研究,TP311.5
- C++代码缺陷检测系统的研究与设计,TP311.53
- 基于Web的科学计算遗留应用共享技术研究,TP393.09
- 基于XML的异构数据交换系统的设计与实现,TP311.52
- 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
- 概率XML数据上关键字检索算法的研究与实现,TP391.3
- 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
- 保留语义约束的XML与关系数据库双向转换技术研究,TP311.13
- 基于银行综合前置平台的金融服务支付系统的设计与实现,TP311.52
- 基于服务总线的模具企业信息集成系统,TP311.52
- 基于Android平台的无线点菜系统的设计与实现,TP311.52
- 大型钢铁企业EDI数据交换平台研究,TP311.52
- 基于FDT/DTM技术设备管理系统的研究与开发,TP311.52
- 基于SOA的协同制造异构系统的数据集成研究,TP311.13
- 基于Agent的旅游信息服务系统构建技术研究,TP393.09
- 佳木斯大学数据中心管理系统的设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|