学位论文 > 优秀研究生学位论文题录展示
面向SOA的XML数据压缩技术研究与应用
作 者: 陈万蓉
导 师: 邵丽
学 校: 首都经济贸易大学
专 业: 产业经济学
关键词: 面向服务架构 XML数据 XML压缩 XML文档合法性检验
分类号: F49
类 型: 硕士论文
年 份: 2010年
下 载: 82次
引 用: 1次
阅 读: 论文下载
内容摘要
近年来随着计算机技术的迅猛发展,XML已经成为Internet上数据表示、存储和交换方面的标准,而电子商务的兴起与企业自身业务的需求又带动了面向服务架构体系(SOA)的蓬勃发展,使得SOA成为当前热门的讨论话题。SOA实质上是组织服务的一种架构模式,它把服务通过统一的、中立的、定义良好的接口和契约联系起来,独立于实现服务的硬件平台、操作系统和编程语言,使服务通过统一通用的方式进行交互。而XML具有的自我描述性与跨平台性,使得它非常符合SOA环境的要求,因此,在SOA体系中使用XML文档作为数据的传输格式和信息载体是XML一个很好的应用。但是,XML文档一个最大缺陷就是它的冗余性,尤其是结构信息大量重复造成XML数据体积庞大,占用过多的存储空间与网络带宽,降低了处理效率,增加了SOA消息的传输难度,造成了SOA数据传输问题。为了解决这个问题,在SOA体系中可以通过对服务器的配置采用Gzip对传输的消息进行压缩,Gzip是通用文本压缩技术而不是专门为XML设计的,而本文考虑了XML数据自身特点和SOA这个具体应用环境,重点研究了面向存储与交换的、适合XML数据的压缩方法,并在前人研究的基础上提出自己的改进。本文首先阐述SOA基本概念、实现途径及由于XML冗余造成的SOA数据传输问题,提出对XML数据进行压缩是解决问题的有效手段。然后介绍XML基本概念、相关处理技术及存在的冗余,并介绍通用数据压缩技术中两种经典算法,分别是哈夫曼编码和LZ77算法,这些基本的压缩算法是所有压缩技术、压缩工具的基础。随后本文叙述了源压缩模型XMill的工作原理,它将结构信息与数据内容相分离,对结构信息进行字典编码压缩,对数据部分按照它们所属标签分门别类地放进相应容器中,用Gzip压缩。在XMill中如果有用户参与,可以根据用户的指令对数据容器选用更适合的压缩方法进行处理,能使压缩率有所提高。本文是在SOA应用环境中,SOA中传输的数据必须遵循XML Schema文档定义的规范,因此,本文在XMill的基础上将辅助结构Schema运用到XML文档的数据压缩部分,Schema中包含所有XML文档元素类型的定义。当把数据放进容器时通过读取XML Schema文档中的数据类型值,选用适合的压缩算法对数据容器进行压缩,而不是一味地只用Gzip,如果某些特殊的数据类型与压缩算法没有匹配成功,就依然使用Gzip压缩,这样做的优势是可以独立于用户参与,减轻用户负担,在一定程度上实现自动化。本文将改进后的模型命名为XS-XMLComp (Based on XML Schema of XML data Compression Technology),它的一个创新之处就是“因地制宜”地运用了辅助性文档XML Schema,并且压缩效果比SOA使用的Gzip要好。本文最后进行了仿真实验,将XS-XMLComp与其他几种压缩模型进行比较,主要比较了压缩率、处理速度和效率等性能指标。通过对实验结果的分析评述了各个方法的优缺点,并且证实本文提出的压缩模型XS-XMLComp具有可行性与有效性,使压缩率有一定提高。
|
全文目录
摘要 4-6 Abstract 6-10 1 绪论 10-19 1.1 选题背景及意义 10-12 1.2 XML数据压缩技术国内外研究现状 12-17 1.3 论文主要研究内容及创新点 17 1.3.1 论文主要研究内容 17 1.3.2 论文创新点 17 1.4 论文结构安排 17-19 2 SOA架构及其数据传输问题 19-28 2.1 SOA基本概念 19-20 2.2 SOA原理及实现架构 20-26 2.2.1 SOA 工作原理 20-21 2.2.2 SOA实现架构 21-26 2.2.3 SOA与Web服务的区别 26 2.3 SOA数据传输面临的问题 26-27 2.4 本章小结 27-28 3 XML及其数据压缩技术 28-40 3.1 XML及相关技术 28-34 3.1.1 XML基本概念 28-30 3.1.2 XML相关技术 30-32 3.1.3 XML优势与缺陷 32-34 3.2 数据压缩算法介绍 34-38 3.2.1 基于统计模型的哈夫曼编码 35-36 3.2.2 基于字典模型的LZ77算法 36-38 3.3 XML数据压缩技术 38-39 3.4 本章小结 39-40 4 基于XML Schema的数据压缩方法及其改进 40-57 4.1 XMill工作原理 40-46 4.1.1 XML文档结构信息与数据值相分离 41-42 4.1.2 分组数据项至数据容器并进行压缩 42-46 4.2 改进模型的基本概念,具体实现及改进措施 46-56 4.2.1 XML结构与数据相分离的实现过程 46-48 4.2.2 数据项分组压缩的实现过程 48-52 4.2.3 运用Schema文档的XML数据压缩改进研究 52-56 4.3 本章小结 56-57 5 改进模型模拟实验研究 57-66 5.1 实验前期准备工作 57-58 5.2 实验结果及性能分析研究 58-64 5.2.1 压缩性能比较 59-61 5.2.2 处理速度和效率比较 61-64 5.3 本章小结 64-66 6 总结与展望 66-68 6.1 总结 66-67 6.2 进一步研究方向 67-68 致谢 68-69 参考文献 69-72 攻读硕士学位期间发表的论文 72-73 详细摘要 73-84
|
相似论文
- 面向服务的Web报表的研究与设计,TP393.09
- 概率XML数据上关键字检索算法的研究与实现,TP391.3
- 地震应急辅助决策支持系统的研究与实现,TP311.52
- 基于服务总线的模具企业信息集成系统,TP311.52
- 模具企业的业务流程集成的研究,TG76
- 基于Android平台的无线点菜系统的设计与实现,TP311.52
- 佳木斯大学数据中心管理系统的设计与实现,TP311.52
- 丽水污染企业环境应急监测平台的研究,TP311.52
- 开放式控制系统软总线及调度的实现,TP273
- 基于XML的安全数据交换系统的应用研究,TP309.2
- 基于SOA的MES系统平台设计与实现,TP393.09
- 基于SCA的遗产系统移植的研究与实现,TP393.09
- 基于SOA的期刊导航系统设计与实现,TP393.09
- 基于XML的异构数据源集成与查询技术研究,TP311.52
- 基于NewsML的新闻管理与发布系统的研究与实现,TP311.52
- 基于企业服务总线的信息系统集成技术研究,TP311.52
- 高职院校教务管理系统分析与设计,TP311.52
- 基于SOA的教务管理系统的设计与实现,TP311.52
- 基于XQuery的联系人管理系统开发,TP311.52
- 基于XML的异构数据交换技术研究,TP311.13
- 基于XML的非结构化数据管理研究及应用,TP311.13
中图分类: > 经济 > 信息产业经济(总论)
© 2012 www.xueweilunwen.com
|