学位论文 > 优秀研究生学位论文题录展示

XML查询中具有位置谓词的树模式匹配方法

作 者: 李发金
导 师: 廖湖声
学 校: 北京工业大学
专 业: 计算机科学与技术
关键词: XML XPath Twig查询
分类号:
类 型: 硕士论文
年 份: 2013年
下 载: 23次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算机网络技术的发展,可扩展标记语言(XML)已经成为互联网上数据表示和传输标准,XML被普遍地用于异构信息和异构平台之间数据交换和数据共享。为了满足查询和处理XML数据的需求,W3C提出了XQuery语言。XQuery和XML数据的关系类似SQL与关系数据库的关系。XQuery很好地结合了XML数据的半结构化特性,能够在XML文档中查询出用户所需的文档片段,或根据XML文档进行科学计算。在对XML文档进行处理时,针对XML数据结构特征进行的XPath查询是实际应用当中最基本和最普通的操作,同时也是最耗时空的操作之一。多数结构查询需求都包含了节点之间的结构约束,若干个相关的祖先后代关系(AD)或双亲子女关系(PC)关系经常表现为一种树型的查询模式。如何高效地查询XML文档已经成为数据库领域的研究热点。采用整体匹配方式的XML树模式查询算法已经得到了深入研究,然而这些算法均未考虑到定义在XPath表达式轴操作上位置谓词的实现需求。由于无法从整体匹配的结果中筛选出符合位置谓词的查询结果,使得这些算法无法用于实现具有位置谓词的XPath查询。本文对XML结构查询中的位置谓词和兄弟轴(following-sibling)的实现方法进行了研究,设计了一种三层结构的嵌套栈,并基于嵌套栈提出了整体模式匹配算法TwigPos。TwigPos处理的查询模式能够同时支持存在谓词、位置谓词和兄弟轴。在不同数据集上的实验说明该算法能够有效地处理此类XPath查询请求,增强了XML树模式查询技术的实用性。

全文目录


摘要  4-5
Abstract  5-6
目录  6-8
第1章 绪论  8-14
  1.1 课题背景  8-9
  1.2 相关研究的概述  9-10
    1.2.1 树模式的表达能力  9
    1.2.2 树模式查询算法  9
    1.2.3 位置谓词和兄弟轴处理的研究现状  9-10
  1.3 本文的研究内容和主要贡献  10-11
  1.4 研究动机  11-12
  1.5 课题来源  12
  1.6 本文组织结构  12-14
第2章 XML 数据处理  14-24
  2.1 XML 语言  14-15
    2.1.1 XML 语言简介  14-15
    2.1.2 XML 文档编码  15
  2.2 XML 查询语言  15-17
    2.2.1 XPath 语言  15-16
    2.2.2 XQuery 语言简介  16-17
  2.3 Twig 查询算法  17-22
    2.3.1 Twig 查询  17-18
    2.3.2 二元结构连接算法  18-20
    2.3.3 整体匹配算法  20-22
  2.4 本章小结  22-24
第3章 ExTwig 拓展树模式  24-28
  3.1 拓展树模式的表示  24-25
  3.2 拓展树模式提取算法  25-26
  3.3 提取算法分析  26-27
  3.4 本章小结  27-28
第4章 嵌套栈结构  28-34
  4.1 三层嵌套栈结构  28-29
  4.2 嵌套栈的基本操作  29-31
  4.3 利用嵌套栈遍历文档树  31
  4.4 遍历算法分析  31-32
  4.5 本章小结  32-34
第5章 TwigPos 算法设计  34-44
  5.1 TwigPos 算法概述  34
  5.2 TwigPos 算法的中间结果表示  34-35
  5.3 位置谓词的处理方法  35-37
  5.4 FS 轴的处理方法  37
  5.5 AD 轴与 PC 轴的处理方法  37-38
  5.6 TwigPos 算法  38-43
    5.6.1 中间结果构造算法  38-40
    5.6.2 枚举算法  40-42
    5.6.3 算法分析  42-43
  5.7 本章小结  43-44
第6章 算法实现及测试  44-52
  6.1 算法实现设计  44-47
    6.1.1 类的具体设计  45-47
  6.2 测试方案  47-49
  6.3 测试结果及分析  49-51
    6.3.1 性能测试  49-50
    6.3.2 可拓展性测试  50-51
  6.4 本章小结  51-52
结论  52-54
参考文献  54-58
攻读硕士学位期间所发表的学术论文  58-60
致谢  60

相似论文

  1. 基因调控网络模型描述语言研究,Q78
  2. 支持XML数据查询的F&B索引结构的研究,TP311.13
  3. LXI自动测试系统集成技术研究,TP274
  4. 基于网络的服装款式设计系统的研究与实现,TS941.2
  5. 基于MDA的界面自动生成方法的研究,TP311.5
  6. C++代码缺陷检测系统的研究与设计,TP311.53
  7. 基于Web的科学计算遗留应用共享技术研究,TP393.09
  8. 利用钻孔资料实现矿体三维可视化,TP391.41
  9. 基于XML的异构数据交换系统的设计与实现,TP311.52
  10. 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
  11. 基于关系数据库理论的面向对象数据库系统应用研究,TP311.52
  12. 支持Top-k查询的银行记账查询系统的设计与实现,TP311.52
  13. 基于B/S多层架构的特种文献系统设计与实现,TP311.52
  14. 基于中间件的科技查新辅助检索系统的设计与实现,TP391.3
  15. 企业异构管理信息系统间数据交换框架的研究,TP311.52
  16. 基于XML的用户界面建模研究与实现,TP311.52
  17. 基于SVG的数据分析图表系统的研究与实现,TP311.52
  18. 模糊XML Twig模式查询算法的研究,TP311.13
  19. 基于.NET的学生顶岗实习管理系统设计与实现,TP311.52
  20. 概率XML数据上关键字检索算法的研究与实现,TP391.3
  21. 通用试题库系统的研究与实现,TP311.52

中图分类: >
© 2012 www.xueweilunwen.com