学位论文 > 优秀研究生学位论文题录展示
DWIIS系统中查询接口集成机制的研究
作 者: 王盛全
导 师: 高克宁
学 校: 东北大学
专 业: 计算机应用技术
关键词: Deep Web 查询接口集成 查询接口模式 结构特征 模式匹配
分类号: TP393.09
类 型: 硕士论文
年 份: 2008年
下 载: 8次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络规模在全球的迅猛发展,Internet上的信息资料目前在以爆炸性的趋势增长,网上的Deep Web站点越来越多,并且还在迅速地增长。Deep Web数据库通过查询接口向用户提供信息,但是相同领域的众多Deep Web数据库各自独立,如果用户想要查询某领域的信息,需要费时费力地逐个查询每个相关的数据库,所以有必要把同一领域内众多相关Deep Web站点进行集成,为用户提供一个集成的查询接口。DWIIS系统是一个Deep Web信息集成系统,为用户提供了一个“一站式”访问Web数据库的途径。在DWIIS系统的实现中,本文提出一种基于结构特征的Deep Web查询接口集成机制,该机制针对接口的结构差异问题,通过查询接口获取工具对接口表单进行分析得到带有结构特征的查询接口模式树,对模式树进行序列化得到模式集属性序列,按属性序列顺序进行模式匹配得到相似度矩阵,最后借助矩阵运算实现集成接口的构建,从而实现自动化的Deep Web查询接口集成,能够最大限度的提高匹配程度。.本文首先提出了带有结构特征的树状查询接口模型,在查询接口模式的构建过程中需要提取表单的结构特征,进而给出了原子属性和复合属性概念,描述了基于结构特征的Deep Web查询接口模式获取流程;其次,阐述了模式匹配方法,完成对相同领域不同模式中属性的相似度计算,通过模式树的结构特征对属性进行后序遍历生成属性序列,进一步按顺序实现复合属性间的相似度计算,得到相似度矩阵;最后,将相似度矩阵转换成等价矩阵,利用等价矩阵及矩阵运算实现集成接口的构造过程。集成过程中等价属性需要解决大量的冲突,本文对常见冲突进行了分类并提出了解决策略,最终由集成模式生成集成的查询接口,实现Deep Web查询接口的集成。实验表明,本文所提出的技术能够高速、准确地支持Deep Web集成数据查询。
|
全文目录
摘要 5-6 Abstract 6-10 第一章 绪论 10-16 1.1 研究背景 10-12 1.2 研究内容 12-14 1.3 本文组织 14-16 第二章 研究基础 16-26 2.1 Deep Web数据集成概述 16-21 2.1.1 Deep Web概念 16-18 2.1.2 Deep Web数据集成 18-20 2.1.3 Deep Web查询接口集成 20-21 2.2 模式集成框架 21-23 2.3 DWIIS系统框架 23-25 2.4 小结 25-26 第三章 Deep Web查询接口集成机制 26-36 3.1 Deep Web查询接口 26-28 3.2 Deep Web查询接口模型 28-31 3.2.1 模型描述 28-29 3.2.2 相关定义 29-31 3.3 Deep Web查询接口集成机制 31-35 3.3.1 查询接口集成总体流程 31-33 3.3.2 查询接口集成实现方法 33-35 3.4 小结 35-36 第四章 查询接口模式获取方法 36-48 4.1 查询接口模式获取流程 36-37 4.2 查询表单特征识别策略 37-42 4.3 查询表单特征获取方法 42-46 4.3.1 查询表单获取 42-43 4.3.2 查询表单特征抽取 43-46 4.4 查询接口模式生成方法 46-47 4.5 小结 47-48 第五章 Deep Web查询接口集成方法 48-66 5.1 模式匹配 48-58 5.1.1 模式匹配方法 48-52 5.1.2 相似度计算 52-55 5.1.3 模式匹配相关算法 55-58 5.2 集成模式构造 58-65 5.2.1 集成模式构造方法 58-60 5.2.2 冲突分类及解决策略 60-65 5.3 小结 65-66 第六章 实验设计与实验结果的分析 66-72 6.1 实验数据 66 6.2 测试标准 66-67 6.3 实验结果与分析 67-71 6.3.1 查询接口模式获取实验 67-69 6.3.2 查询接口集成实验 69-71 6.4 小结 71-72 第七章 结论 72-74 参考文献 74-78 致谢 78
|
相似论文
- 中国优秀冰壶运动员专项体能结构特征研究,G862.6
- 两个与棉纤维发育相关基因的克隆与鉴定及七个与脂肪酸代谢相关基因的表达分析,S562
- Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
- 基于启发式算法的恶意代码检测系统研究与实现,TP393.08
- 基于CUDA的正则表达式匹配系统的设计与实现,TP311.52
- Windows系统内核Rootkit的检测技术研究,TP309
- 僵尸控制行为识别及检测方法研究,TP393.08
- Ares协议分析与流量检测机制研究,TP393.06
- 基于Web日志的入侵检测系统设计与实现,TP393.08
- 云计算中依赖任务动态并行调度机制的研究,TP3
- 虹膜识别关键技术的研究,TP391.41
- 外商群体投资治理结构及其溢出效应研究,F224
- 基于模式匹配与协议分析的分布式入侵检测研究,TP393.08
- 反抄袭检测系统的研究与实现,TP391.1
- Deep Web集成系统中同类主题数据源选择方法研究,TP311.13
- 指纹识别相关算法的改进研究,TP391.41
- 中国香青属植物系统分类学初步研究,Q948
- 掺杂大晶粒多晶Si薄膜的制备与电学特性,TM914.42
- 粪鬼伞菌丝体多糖的分离纯化、结构分析和对S-180肿瘤的抑制作用研究,R285
- 新疆维吾尔族城市居民维汉口语句间语码转换研究-以乌鲁木齐为例,H102
- 电视节目“希望英语杂志”中语码转换的研究,H08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|