学位论文 > 优秀研究生学位论文题录展示
连续不确定XML编码及查询技术研究
作 者: 吕庆
导 师: 张晓琳
学 校: 内蒙古科技大学
专 业: 计算机应用技术
关键词: 连续不确定 XML 素数编码 非归并
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 5次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,随着科学技术的进步,数据的处理和采集技术也得到突飞猛进的发展,人们对于不确定性数据的关注也越来越多,在不确定性数据中包含离散的不确定和连续的不确定两种类型的数据。在现实社会中,人们描述信息存在各异性、认知事物具有片面性、数据具有动态变化性和物理器件度量存在的差异性等都会造成不确定性数据的产生。在很多实际应用领域中连续不确定性数据被广泛应用,例如军事、经济、金融、电信和物流等领域。传统的关系型数据库具有结构化的特点,不适用于对不确定性数据的管理。而XML具有易扩展、具有灵活性和可自描述性等优点,使其成为结构化和半结构化数据进行交换、存储的主要数据形式之一,并且特别适用于数据抽取和数据集成等领域。当前XML数据管理技术对于确定性数据的管理已经很成熟,但对于不确定性数据管理的研究还很少。连续不确定性的数据通常采用一个连续的概率密度函数表示,用XML文档来存储连续的概率密度函数就构成了连续不确定XML,如何对其进行管理受到研究者们越来越多的关注。首先,针对已有不确定XML数据的编码方案(区间编码和前缀编码)存在的诸多问题,例如编码过程需要两次遍历文档树、编码值占用的存储空间过大以及不支持更新等。本文提出一种新的基于p-文档模型的素数编码方案CUPE(continuous uncertain prime encoding),编码过程只需一次遍历文档树,重复利用小素数编码,支持文档的更新,克服了以上缺点。其次,考虑基于归并的不确定XML的查询处理算法在匹配过程中需要开辟大量的堆栈,浪费存储空间,查询效率低。提出一种新的非归并的匹配算法CUTwigList,该算法利用节点的编码进行结构关系的判定,判定完成后建立相关链表存储中间结果,匹配过程不需要归并,节省了时间与空间,提高了查询的效率。最后进行了大量的对比实验,在时间性能、空间性能和更新效率方面,将提出的CUPE编码算法分别与区间编码算法、前缀编码算法进行对比;设定不同的查询条件,将提出的非归并的CUTwigList与归并的算法进行对比,并对最终的实验结果进行了详细的分析,证明了所提出的两种算法具有高效性。
|
全文目录
摘要 3-4 Abstract 4-9 引言 9-10 1 绪论 10-20 1.1 研究背景 10-13 1.1.1 不确定性数据的产生原因及应用 10-12 1.1.2 XML 文档中表示不确定性数据的优势 12-13 1.2 XML 编码技术研究现状 13-16 1.2.1 普通 XML 编码技术研究现状 13-15 1.2.2 不确定 XML 编码技术研究现状 15-16 1.3 XML 查询技术研究现状 16-18 1.3.1 普通 XML 查询技术研究现状 16-18 1.3.2 不确定 XML 查询技术研究现状 18 1.4 主要工作及组织结构 18-20 2 连续不确定 XML 数据管理的基本概念及理论基础 20-29 2.1 连续不确定性数据 20-21 2.2 连续不确定性数据模型 21-25 2.2.1 可能世界模型 21-22 2.2.2 概率树模型 22-23 2.2.3 p文档模型 23-25 2.3 连续不确定 XML 编码技术 25-27 2.4 连续不确定 XML 的 Twig 查询技术 27-28 2.5 本章小结 28-29 3 连续不确定 XML 的 CUPE 编码算法 29-35 3.1 CUPE 编码方案 29-31 3.1.1 编码规则 29-30 3.1.2 编码举例 30-31 3.2 CUPE 编码算法 31 3.3 结构关系判定 31-33 3.3.1 算术基本定理 31-32 3.3.2 关系判定 32-33 3.4 支持更新 33-34 3.5 本章小结 34-35 4 连续不确定 XML 的 CUTwigList 小枝模式查询算法 35-42 4.1 算法主要思想 35-36 4.1.1 整体小枝匹配算法思想 35-36 4.1.2 CUTwigList 算法思想 36 4.2 查询结果概率值计算 36-37 4.3 CUTwigList 性能分析 37-39 4.3.1 算法描述 37-39 4.3.2 算法复杂度分析 39 4.4 算法实例说明 39-41 4.5 本章小结 41-42 5 实验结果及分析 42-49 5.1 实验环境 42-43 5.2 实验数据 43-44 5.3 实验结果分析 44-48 5.3.1 CUPE 编码方案性能测试 44-46 5.3.2 CUTwigList 算法性能测试 46-48 5.4 本章小结 48-49 结论 49-51 参考文献 51-56 附录 A 连续不确定 XML 模式 56-59 在学研究成果 59-60 致谢 60
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- LXI自动测试系统集成技术研究,TP274
- 基于网络的服装款式设计系统的研究与实现,TS941.2
- 基于MDA的界面自动生成方法的研究,TP311.5
- C++代码缺陷检测系统的研究与设计,TP311.53
- 基于Web的科学计算遗留应用共享技术研究,TP393.09
- 利用钻孔资料实现矿体三维可视化,TP391.41
- 基于XML的异构数据交换系统的设计与实现,TP311.52
- 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
- 基于关系数据库理论的面向对象数据库系统应用研究,TP311.52
- 电力系统多元化信息分发处理系统设计,TP311.52
- 基于Multi-Agent的情报信息平台的设计与实现,TP311.52
- SOA架构在高校信息化系统中整合技术的应用,TP311.52
- 面向数字化校园的数据交换存储平台研究与实现,TP311.52
- 基于SOA架构的电信综合网管系统的设计与实现,TP311.52
- 运载火箭数字化智能数据评估系统,TP311.52
- 基于SOA的协同制造异构系统的数据集成研究,TP311.13
- CDMA2000核心网性能测试工具的设计与实现,TP311.52
- 基于反编译的可疑行为标注技术的研究与实现,TP309
- 支持Top-k查询的银行记账查询系统的设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|