学位论文 > 优秀研究生学位论文题录展示
基于XML的异构数据库集成中间件技术研究
作 者: 曹虎
导 师: 张国印
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 异构数据集成 模式映射 机器学习 FLSD XMLHDIM
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 198次
引 用: 4次
阅 读: 论文下载
内容摘要
信息化建设不断地深入使人们对现存各种异构数据的共享与交换需求不断增强。因此就需要一种有效的方案来解决异构环境中的数据共享与交换,以使各系统之间构成一个开放协同的软件环境来高效完成各项工作和业务决策。针对这一需求,本文结合“黑龙江省企业和企业法定代表人信用档案系统”这一具体项目对异构数据库集成相关技术进行了深入研究。本文首先对异构数据库集成各种相关技术的作用及其优势与不足进行了讨论。然后对异构数据集成中的关键技术模式映射进行了深入研究,提出了FLSD模式映射方法,FLSD方法在LSD方法的基础上增加了一个反馈机制,使机器学习系统能够动态学习工作过程中产生的新知识,不断提高系统的匹配正确率与完全率。此外,FLSD还增加了一个基于约束的学习器,该学习器弥补了被LSD方法原有学习器忽略的模式元素特征信息,使系统匹配准确率进一步获得提升。本文结合FLSD方法,设计了XMLHDIM中间件系统,其采用的Lav模式集成方式使系统具备了较好的可扩展性;XMLHDIM系统使用FLSD方法进行模式匹配,这使得模式匹配工作的自动化有了较大的提高,降低了人工匹配的工作量,提升了模式匹配的工作效率。最后将FLSD方法应用到了“黑龙江省企业和企业法定代表人信用档案系统”中,在该系统实际运行的基础上,对FLSD方法的工作性能进行了实验。实验结果表明FLSD方法能够较大地提升模式映射的匹配准确率与完全率,使模式匹配工作的自动化程度进一步提高。基于机器学习的FLSD方法对异构数据库集成中间件技术的理论与实践具有现实指导意义。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-15 1.1 研究背景及意义 10-11 1.2 国内外研究现状 11-13 1.3 研究内容 13 1.4 论文结构 13-15 第2章 异构数据库集成相关技术研究 15-27 2.1 异构数据整合技术 15-18 2.1.1 数据的异构性 15-16 2.1.2 数据整合的概念 16-17 2.1.3 数据整合方式及分析 17-18 2.2 中间件技术 18-24 2.2.1 中间件定义 19 2.2.2 数据库中间件及其优点 19-21 2.2.3 典型数据库中间件及其对比 21-24 2.3 XML技术 24-26 2.3.1 XML概念 24 2.3.2 XML与异构数据整合 24-25 2.3.3 DTD与XML Schema对比 25-26 2.4 本章小结 26-27 第3章 模式集成技术 27-44 3.1 中介模式 27-28 3.2 模式集成 28-31 3.2.1 模式集成方式 29-30 3.2.2 模式映射关系的生成 30-31 3.3 LSD方法 31-35 3.3.1 LSD方法的学习器 32-33 3.3.2 LSD方法的工作过程 33-35 3.4 FLSD方法 35-42 3.4.1 FLSD方法的模式定义 35-36 3.4.2 FLSD方法的学习阶段 36-38 3.4.3 FLSD方法的分类阶段 38-41 3.4.4 FLSD方法的反馈阶段 41-42 3.5 本章小结 42-44 第4章 数据库中间件系统的设计 44-54 4.1 系统设计目标 44-45 4.2 系统架构 45-52 4.2.1 全局虚拟查询 47-48 4.2.2 包装器管理 48-49 4.2.3 数据库注册与注销 49-50 4.2.4 数据库连接池管理 50-51 4.2.5 元数据管理 51-52 4.2.6 XML缓存管理 52 4.3 系统特点 52-53 4.4 本章小结 53-54 第5章 实验结果及分析 54-61 5.1 实验方案 54-55 5.2 反馈系统实验 55-57 5.3 Lc学习器实验 57-58 5.4 FLSD方法实验 58-60 5.5 本章小结 60-61 结论 61-63 参考文献 63-67 攻读硕士学位期间发表的论文和取得的科研成果 67-68 致谢 68
|
相似论文
- 海量多数据库集成系统的查询处理研究,TP311.13
- 基于数据分布特征的文本分类研究,TP391.1
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- Android恶意软件静态检测方案的研究,TP309
- 监督主题模型的研究与应用,TP391.1
- 基于失真效应的图像质量评价与分类,TP391.41
- 基于学习的逆向运动学人体运动合成,TP391.41
- 基于内容的网页恶意代码检测的研究与实现,TP393.092
- 学术主页信息抽取系统的研究,TP393.092
- 社会化网络中的推荐算法及其应用,TP391.3
- 数据挖掘在邮件反垃圾系统中的应用,TP393.098
- 基于自学习的社会关系抽取的研究,TP391.1
- 基于统计与图模型的若干机器学习算法及其应用,TP181
- P2P流量识别方法研究,TP393.06
- 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
- 基于SIFT特征和SVM的场景分类,TP391.41
- 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
- 随机森林特征选择,TP311.13
- 互联网流量应用基准分类技术的研究,TP393.06
- 基于丰富特征和多核学习的蛋白质关系抽取,Q51
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|