学位论文 > 优秀研究生学位论文题录展示
连续不确定XML数据查询处理技术研究
作 者: 霍伟
导 师: 张晓琳
学 校: 内蒙古科技大学
专 业: 计算机应用技术
关键词: 连续不确定XML 小枝查询模式 蒙特卡洛 随机样本集 线性拟合
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 1次
引 用: 0次
阅 读: 论文下载
内容摘要
针对信息交换过程中数据格式异构性而提出的解决方案,XML技术已成为数据表示和数据传输的标准,同时IDC报告显示,500家受访企业的IT部门中,超过30%宣称正在大量使用XML数据库,进而使高效的XML数据管理技术成为迫切的研究需求。在经济、军事、物流、金融、电信等现实应用领域,由于原始数据集本身不准确或为了满足特殊应用目的以及在处理数据集过程中产生的不确定信息普遍存在且扮演关键角色,进而使连续不确定XML数据问题的研究具有较大现实意义。同时查询分析处理是不确定性数据管理的最终目标,所以解决更多的查询类型,开发更为高效的查询方法是XML数据管理当中重要的且核心的研究目标。针对记录了多个随机变量分布特征的连续不确定XML数据,即多维连续不确定XML数据,提出一种基于蒙特卡洛思想的数据查询处理算法QueryMC。在查询计算过程中,根据小枝查询模式确定待处理多维随机变量联合概率密度函数及查询区域,通过构造相同区域上的均匀分布随机变量将查询问题建模成相应复合函数的期望,利用算法同时产生的随机样本集估计该期望的取值作为问题的解,避免了传统的降维操作,有效地减少了处理时间。同时对于目前连续不确定XML数据同步多区间的查询处理算法易造成较大时间开销的问题,提出一种基于蒙特卡洛最小二乘思想的小枝模式查询处理算法QueryLSMC。算法根据查询请求依节点遍历序列顺序处理路径栈中节点,利用链表匹配并存储中间结果,通过构造随机样本集线性拟合目标节点中的连续分布函数,避免了对大量矩形分段的处理,有效地减少了计算量。将XML数据集应用于实验对所提出查询处理策略进行测试并与现有方法比较,结果表明,在取得理想精度的同时,算法具有高效性。
|
全文目录
摘要 3-4 Abstract 4-8 引言 8-9 1 绪论 9-19 1.1 研究背景 9-13 1.1.1 不确定性数据的应用背景 9-11 1.1.2 选用 XML 表示不确定性数据的优势 11-13 1.2 国内外研究现状 13-17 1.2.1 不确定 XML 数据模型分析 13-15 1.2.2 不确定 XML 查询处理方案分析 15-17 1.3 主要工作及组织结构 17-19 2 连续不确定 XML 数据管理的基本概念及理论基础 19-29 2.1 数据的不确定性 19-21 2.2 连续不确定 XML 数据 21-22 2.3 p-文档模型 22-24 2.4 蒙特卡洛模拟方法与蒙特卡洛最小二乘思想 24-27 2.4.1 蒙特卡洛模拟方法 24-26 2.4.2 蒙特卡洛最小二乘思想 26-27 2.5 多维连续分布随机变量 27 2.6 连续不确定 XML 数据 twig 查询模式 27-28 2.7 本章小结 28-29 3 多维连续不确定 XML 数据 QueryMC 查询处理算法 29-34 3.1 问题的提出及动机 29 3.2 算法核心思想 29-32 3.2.1 整体小枝匹配算法思想 29-31 3.2.2 QueryMC 算法思想 31-32 3.3 QueryMC 查询处理算法 32-33 3.4 本章小结 33-34 4 连续不确定 XML 数据同步多区间查询处理算法 QueryLSMC 34-40 4.1 问题的提出及动机 34 4.2 算法核心思想 34-38 4.2.1 twigList 匹配算法思想 34-36 4.2.2 QueryLSMC 算法思想 36-38 4.3 QueryLSMC 查询处理算法 38-39 4.4 本章小结 39-40 5 实验结果及分析 40-47 5.1 实验环境 40-41 5.2 实验数据 41-42 5.3 实验结果分析 42-46 5.3.1 QueryMC 算法性能测试 42-45 5.3.2 QueryLSMC 算法性能测试 45-46 5.4 本章小结 46-47 结论 47-49 参考文献 49-54 附录A 连续不确定XML 模式 54-56 在学研究成果 56-57 致谢 57
|
相似论文
- 复杂边界条件下多体结构的瞬态热分析,TK124
- 数量特征敏感问题两阶段整群抽样的统计方法及其应用,R195
- 岩体结构面信息数字识别及强度评价,TU452
- 结构型随机变分不等式的准蒙特卡洛方法,O22
- 基于蒙特卡洛方法和改进PSO算法的装配公差优化设计,TG801
- 基于蒙特卡洛法的配电网可靠性评估,TM732
- 数码相机中Bayer格式数字图像的降噪与颜色插值算法的研究,TP391.41
- 基于DCCA和MF-DCCA的步态信号的分析与研究,TN911.6
- 巨型国际集装箱船舶投资风险评价,F224
- 实际光学系统仿真成像研究,TP391.41
- 六自由度并联地震模拟振动台全误差分析及标定研究,P315.8
- 基于蒙特卡洛方法的航空电子维修产能模拟及预测,F224;F426.63
- 测试性虚拟验证技术及其在直升机航向姿态系统中的应用研究,V249.122.2
- 商业银行理财产品收益风险特征及评价指标分析,F832.2
- 军事通信网络效能稳健评估分析方法研究,TN915.851
- PERT网络总工期概率特性研究,TU721.3
- 我国商业银行操作风险计量模型及实证研究,F832.2
- 分布式多视角目标跟踪的统计推理方法及实现,TP391.41
- 公私合营项目投资决策的优化研究,F224
- 外磁场下磁性纳米粒子与高分子刷共混体系的蒙特卡洛模拟,O441.4
- 基于实物期权的创业投资决策方法探讨,F832.48
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|