学位论文 > 优秀研究生学位论文题录展示
XML查询中具有位置谓词的树模式匹配方法
作 者: 李发金
导 师: 廖湖声
学 校: 北京工业大学
专 业: 计算机科学与技术
关键词: XML XPath Twig查询
分类号:
类 型: 硕士论文
年 份: 2013年
下 载: 23次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机网络技术的发展,可扩展标记语言(XML)已经成为互联网上数据表示和传输标准,XML被普遍地用于异构信息和异构平台之间数据交换和数据共享。为了满足查询和处理XML数据的需求,W3C提出了XQuery语言。XQuery和XML数据的关系类似SQL与关系数据库的关系。XQuery很好地结合了XML数据的半结构化特性,能够在XML文档中查询出用户所需的文档片段,或根据XML文档进行科学计算。在对XML文档进行处理时,针对XML数据结构特征进行的XPath查询是实际应用当中最基本和最普通的操作,同时也是最耗时空的操作之一。多数结构查询需求都包含了节点之间的结构约束,若干个相关的祖先后代关系(AD)或双亲子女关系(PC)关系经常表现为一种树型的查询模式。如何高效地查询XML文档已经成为数据库领域的研究热点。采用整体匹配方式的XML树模式查询算法已经得到了深入研究,然而这些算法均未考虑到定义在XPath表达式轴操作上位置谓词的实现需求。由于无法从整体匹配的结果中筛选出符合位置谓词的查询结果,使得这些算法无法用于实现具有位置谓词的XPath查询。本文对XML结构查询中的位置谓词和兄弟轴(following-sibling)的实现方法进行了研究,设计了一种三层结构的嵌套栈,并基于嵌套栈提出了整体模式匹配算法TwigPos。TwigPos处理的查询模式能够同时支持存在谓词、位置谓词和兄弟轴。在不同数据集上的实验说明该算法能够有效地处理此类XPath查询请求,增强了XML树模式查询技术的实用性。
|
全文目录
摘要 4-5 Abstract 5-6 目录 6-8 第1章 绪论 8-14 1.1 课题背景 8-9 1.2 相关研究的概述 9-10 1.2.1 树模式的表达能力 9 1.2.2 树模式查询算法 9 1.2.3 位置谓词和兄弟轴处理的研究现状 9-10 1.3 本文的研究内容和主要贡献 10-11 1.4 研究动机 11-12 1.5 课题来源 12 1.6 本文组织结构 12-14 第2章 XML 数据处理 14-24 2.1 XML 语言 14-15 2.1.1 XML 语言简介 14-15 2.1.2 XML 文档编码 15 2.2 XML 查询语言 15-17 2.2.1 XPath 语言 15-16 2.2.2 XQuery 语言简介 16-17 2.3 Twig 查询算法 17-22 2.3.1 Twig 查询 17-18 2.3.2 二元结构连接算法 18-20 2.3.3 整体匹配算法 20-22 2.4 本章小结 22-24 第3章 ExTwig 拓展树模式 24-28 3.1 拓展树模式的表示 24-25 3.2 拓展树模式提取算法 25-26 3.3 提取算法分析 26-27 3.4 本章小结 27-28 第4章 嵌套栈结构 28-34 4.1 三层嵌套栈结构 28-29 4.2 嵌套栈的基本操作 29-31 4.3 利用嵌套栈遍历文档树 31 4.4 遍历算法分析 31-32 4.5 本章小结 32-34 第5章 TwigPos 算法设计 34-44 5.1 TwigPos 算法概述 34 5.2 TwigPos 算法的中间结果表示 34-35 5.3 位置谓词的处理方法 35-37 5.4 FS 轴的处理方法 37 5.5 AD 轴与 PC 轴的处理方法 37-38 5.6 TwigPos 算法 38-43 5.6.1 中间结果构造算法 38-40 5.6.2 枚举算法 40-42 5.6.3 算法分析 42-43 5.7 本章小结 43-44 第6章 算法实现及测试 44-52 6.1 算法实现设计 44-47 6.1.1 类的具体设计 45-47 6.2 测试方案 47-49 6.3 测试结果及分析 49-51 6.3.1 性能测试 49-50 6.3.2 可拓展性测试 50-51 6.4 本章小结 51-52 结论 52-54 参考文献 54-58 攻读硕士学位期间所发表的学术论文 58-60 致谢 60
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- LXI自动测试系统集成技术研究,TP274
- 基于网络的服装款式设计系统的研究与实现,TS941.2
- 基于MDA的界面自动生成方法的研究,TP311.5
- C++代码缺陷检测系统的研究与设计,TP311.53
- 基于Web的科学计算遗留应用共享技术研究,TP393.09
- 利用钻孔资料实现矿体三维可视化,TP391.41
- 基于XML的异构数据交换系统的设计与实现,TP311.52
- 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
- 基于关系数据库理论的面向对象数据库系统应用研究,TP311.52
- 支持Top-k查询的银行记账查询系统的设计与实现,TP311.52
- 基于B/S多层架构的特种文献系统设计与实现,TP311.52
- 基于中间件的科技查新辅助检索系统的设计与实现,TP391.3
- 企业异构管理信息系统间数据交换框架的研究,TP311.52
- 基于XML的用户界面建模研究与实现,TP311.52
- 基于SVG的数据分析图表系统的研究与实现,TP311.52
- 模糊XML Twig模式查询算法的研究,TP311.13
- 基于.NET的学生顶岗实习管理系统设计与实现,TP311.52
- 概率XML数据上关键字检索算法的研究与实现,TP391.3
- 通用试题库系统的研究与实现,TP311.52
中图分类: >
© 2012 www.xueweilunwen.com
|