学位论文 > 优秀研究生学位论文题录展示
基于XML的概率数据模型研究
作 者: 张群
导 师: 王新军
学 校: 山东大学
专 业: 计算机软件与理论
关键词: 概率 XML 归并 数据依赖 数据模型
分类号: TP311.13
类 型: 硕士论文
年 份: 2008年
下 载: 82次
引 用: 0次
阅 读: 论文下载
内容摘要
人类认知存在的局限性、信息描述的差异、度量的误差以及数据的动态变化等等,往往会产生许多不确定的数据。而随着不确定性研究的深入,未来世界的不确定性特征逐渐得到现代学术界的普遍认可。但是传统的关系模型对不确定数据的表示与存储缺乏处理,因此,有关概率数据模型的研究受到了广泛关注,首先出现了基于关系的概率数据模型,但其结构化的特点决定了它不适用于存储和处理概率数据。网络技术的蓬勃发展,更加增加了数据的多样性和不确定性,这些数据往往有着不同的结构,不同的来源,以及不同的产生原因,所以各数据源之间的规模、可信度与可用度往往也存在较大的差距,因此需要有新的比结构化方式更适宜的存储方式。随着XML的出现及快速发展,XML已经普遍用于Web上的数据表示与交换,而且XML的半结构化、自描述性好及可扩展性高等许多优点,使其在概率数据表示上与关系概率模型相比较占优势。目前已有基于XML的概率数据模型的相关研究,但已有模型的查询操作多局限于单个数据源,对于多数据源情况下的概率数据的管理却缺乏研究。不同来源的数据,其规模、可信度,以及数据的有效时间,生成时间以及数据源被查询引用的次数等等,这些信息都应该对多数据源下概率数据的管理产生影响,而不应被忽略。本文在已有模型思想的基础上,提出了一种扩展的基于XML的概率数据模型。新模型使得概率查询操作不再局限于单个数据源,而是充分利用各数据源自身的信用度、规模等信息,支持多数据源情况下XML概率数据间的归并与查询操作,从而可以提供更加真实有效的信息。本文的主要工作如下:(1)讨论了不确定性数据的产生途径,并对概率数据模型的研究现状进行了分析,分别总结了基于关系与基于XML两大类概率数据模型的特点与不足。(2)根据已有模型的思想,提出了一种扩展的基于XML的概率数据模型,给出新模型的形式化定义及其所要满足的DTD描述,分析其单实例查询及多实例归并与查询的实现方案与算法。此外,新模型还解决了用XML表示概率数据所引入的数据依赖问题。(3)对新模型的性质进行分析,证明新模型的操作在该模型上的封闭性,兼容性与统一性等。(4)对模型的实现架构与实验环境进行讨论,通过实验,对新模型的查询归并等操作的性能进行了分析。
|
全文目录
摘要 8-10 ABSTRACT 10-12 第一章 绪论 12-16 1.1 研究背景 12-14 1.2 论文的主要工作与创新点 14-15 1.3 论文的组织结构 15-16 第二章 概率数据模型 16-23 2.1 不确定数据的产生 16-19 2.1.1 移动对象与传感器数据 16-17 2.1.2 图像处理与模式识别 17-18 2.1.3 信息抽取与集成 18-19 2.2 概率数据模型研究现状 19-23 2.2.1 基于关系的概率数据模型 19-22 2.2.1.1 PRM模型 20-21 2.2.1.2 ProbView模型 21-22 2.2.2 基于XML的概率数据模型的出现 22-23 第三章 基于XML的概率数据模型 23-34 3.1 XML相关知识 23-24 3.2 XML存储 24-26 3.3 原生XML数据库 26-29 3.3.1 Tamino 26-27 3.3.2 Xindice 27 3.3.3 Lore 27 3.3.4 OrientX 27-28 3.3.5 eXist 28-29 3.4 基于XML的概率数据模型研究 29-34 3.4.1 SPO模型 29-31 3.4.2 ProTDB模型 31-34 第四章 XPDM模型 34-46 4.1 形式化定义 34-35 4.2 XPDM所满足的DTD描述 35-38 4.3 XPDM模型的主要操作 38-43 4.3.1 单个XPDM实例查询 38-39 4.3.2 两个XPDM实例间归并操作 39-42 4.3.3 两个XPDM实例间查询操作 42-43 4.3.4 n个XPDM实例间查询操作 43 4.4 XPDM模型的性质 43-46 4.4.1 封闭性 43-45 4.4.2 兼容性与统一性 45-46 第五章 系统的设计与实现 46-49 5.1 系统的实验环境 46 5.2 系统架构与实现 46-47 5.3 实验结果 47-49 第六章 总结与展望 49-50 参考文献 50-53 致谢 53-54 攻读学位期间发表的学术论文目录 54-55 攻读学位期间参与科研项目情况 55-56 学位论文评阅及答辩情况表 56
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 某武器系统效能评估方法研究,TJ06
- 病险水库溃坝概率分析方法研究,TV697
- 溃坝生命损失风险评价的关键技术研究,TV122.4
- 说话人识别中不同语音编码影响的补偿方法,TN912.34
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- 动态环境下移动对象导航系统相关技术的研究,TP301.6
- LXI自动测试系统集成技术研究,TP274
- 多机器人合作追捕目标问题研究,TP242
- 基于网络的服装款式设计系统的研究与实现,TS941.2
- 基于MDA的界面自动生成方法的研究,TP311.5
- 中国碳排放水平的区域差异及影响因素分析,X502
- 中英“统计与概率”领域初中课程内容标准比较与思考,G633.6
- C++代码缺陷检测系统的研究与设计,TP311.53
- D.R.斯汀森《密码学》中一些传统编码与破译方法的改进,TN918.1
- 基于Web的科学计算遗留应用共享技术研究,TP393.09
- 一些亏损更新方程解渐近等价的条件,O211.67
- 宽相依结构随机和尾概率的渐近性,O211.5
- 带广义负相依增量的随机和的渐近性,O211.5
- 基于XML的异构数据交换系统的设计与实现,TP311.52
- 中部地区融合金融服务业的产业结构升级研究,F832.2
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|