学位论文 > 优秀研究生学位论文题录展示

基于XML技术历史数据归档与重构的研究应用

作 者: 王岩
导 师: 张兴忠
学 校: 太原理工大学
专 业: 计算机应用技术
关键词: XML技术 数据归档 数据重构 XML索引查询 分级管理
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 39次
引 用: 0次
阅 读: 论文下载
 

内容摘要


企业信息系统数据库中积累了大量的历史数据,这些数据不仅占用大量的存储空间,同时使得系统运行不稳定性和不安全性因素增加。但是,这些过期数据不能被轻易地删除,因为这些数据并不是毫无价值的。它们是数据挖掘和联机分析处理重要的数据来源和操作对象,是企业进行分析决策时重要的数据基础,因此,如何科学有效的管理和存储这些过期数据,成为企业管理人员面临的巨大挑战。可扩展标记语言XML(Extensible Markup Language)是本文研究工作的重要基础。本文将XML技术应用于数据归档,改变关系数据库存储归档历史数据的方式,同时保证数据的可访问性、可利用性和有效性,避免了因系统和平台的差异所造成的数据无效问题。本课题为了解决由于数据库中存在大量过期数据,造成的系统运行速度减慢,系统不稳定性增加,数据检索效率降低等问题,设计研发历史数据归档系统。根据实际应用的需求,本文提出了一种基于XML技术,以JAVA+TOMCAT+STRUTS2为体系架构的数据归档系统的总体设计方案;分析确定了归档,检索和重构三大功能模块,设计实现了历史数据的归档系统。本文深入探讨了数据归档系统开发过程中所涉及的关键技术,主要包括关系模式和XML模式之间的转换映射方法,代码回替方法,重构前后数据的代码一致性问题和解决方法,XML文件索引检索算法等,并在此基础上对该系统的总体架构进行了分析,细致地研究了各功能模块的基本原理与应用。本文在深入分析原有的归档策略的基础上,提出了归档数据分级存储管理的思想,将分级管理思想应用到系统设计当中,提高了归档数据的存储空间和检索数据的效率。本文实现XML文件检索功能过程中,对采用的多分支索引路径算法进行了改进。当系统获得单分支路径查询结果,不是将单路径查询结果通过连接操作获得多路径结果,而是充分利用索引,通过索引表判断结点的关系,从而进一步判断标签的关系。与原有算法相比,在查询语句较长,查询项较多的情况下,改进后的多分支路径算法具有更高的检索效率。系统目前正处于试运行阶段,运行结果表明,系统运行情况稳定,安全实用,操作简单,大大改善了管理信息系统的运行状况,提高了系统的运行效率,增强了系统的安全性和可靠性,同时降低了企业为维护数据信息所投入的人力物力,具有良好的开发和应用前景。

全文目录


摘要  3-5
ABSTRACT  5-10
第一章 绪论  10-14
  1.1 开发背景及现实意义  10
  1.2 国内外研究动态  10-11
  1.3 本文的主要工作  11-12
  1.4 论文的组织结构  12-14
第二章 数据仓库技术与XML技术  14-24
  2.1 数据仓库技术和数据归档与重构  14-16
    2.1.1 数据仓库的特点  14-15
    2.1.2 数据组织方式  15
    2.1.3 数据归档与重构定义  15-16
  2.2 XML技术  16-23
    2.2.1 XML特点  16-17
    2.2.2 XML功能要素介绍  17-18
    2.2.3 XML存储粒度策略介绍  18-21
    2.2.4 XML在数据归档中的应用与优势  21-23
  2.3 本章小结  23-24
第三章 归档系统的系统分析与设计  24-30
  3.1 需求分析  24-25
    3.1.1 系统现状  24
    3.1.2 总体目标  24-25
  3.2 系统体系结构图  25-26
  3.3 网络拓扑图  26
  3.4 功能组成图  26-29
  3.5 本章小结  29-30
第四章 系统主要功能模块的设计实现  30-50
  4.1 数据归档模块实现  30-34
    4.1.1 归档模块主要工作任务  30-31
    4.1.2 关系模式到XML模式映射方法  31-33
    4.1.3 代码回替技术  33-34
    4.1.4 归档数据分级存储实现  34
  4.2 XML文档检索模块实现  34-45
    4.2.1 文档检索模块主要工作  34-35
    4.2.2 XML索引更新的实现方法  35-39
    4.2.3 XML多分支路径查询算法  39-45
  4.3 数据重构模块实现  45-49
    4.3.1 重构模块主要工作任务  45
    4.3.2 XML模式到关系模式的映射  45-46
    4.3.3 归档前后数据差别的判断方法  46-47
    4.3.4 归档数据重构原理  47
    4.3.5 归档数据重构实现方法  47-49
  4.4 本章小结  49-50
第五章 测试与运行结果  50-58
  5.1 系统测试  50-53
    5.1.1 测试环境  50
    5.1.2 测试方法  50-51
    5.1.3 测试项目  51-53
  5.2 运行结果图  53-57
  5.3 小结  57-58
第六章 总结与展望  58-60
  6.1 应用效果  58
  6.2 应用前景  58-59
  6.3 不足之处  59
  6.4 改进方向  59-60
参考文献  60-64
致谢  64-66
攻读硕士学位期间发表的论文  66

相似论文

  1. 基于观察者模式的银行主动服务系统的设计与实现,TP311.52
  2. 警用视频无线肩咪研究与开发,TP309.7
  3. 天杭社区高血压分级管理效果评价,R544.1
  4. 钢铁企业质量管理与数据集成,TP311.52
  5. 地方电子政府信息资源共享问题研究,TP399-C2
  6. 基于XML技术异构数据转换模型的研究与实现,TP311.52
  7. HN Corporation Training System Research Based on Hierarchy Management,F272.92
  8. 基于XML和JAVA的通用课程教学网站设计与开发,TP393.092
  9. 基于ASP.net技术的中职学生信息管理系统研究,TP311.52
  10. 用于XML文档更新计算的编码方案研究,TP311.10
  11. 基于XML的半结构化数据存储技术研究,TP311.13
  12. 基于混合架构的高校毕业生就业服务系统的研究与实现,TP311.52
  13. 叠前近偏移距数据重构和自由表面多次波压制方法研究,P631.4
  14. 智能办公与网络会议系统的客户端软件的设计与实现,TP311.52
  15. 汽车产业链协作ASP平台数据归档与重构的策略研究,TP311.52
  16. 基于XML的公安档案管理系统设计与实现,TP311.52
  17. 基于层次灰色系统理论的陕西省环评项目分级管理研究,X321
  18. 食品卫生监督量化分级管理在苏州市学生集体用餐监督中的应用研究,R155.5
  19. 面向Web的个性化健康信息系统的研究,TP311.52
  20. P2P污染文件传播抑制策略的研究,TP393.02
  21. 曲面仿生光学复眼建模设计及其加工路径规划研究,TB17

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com