学位论文 > 优秀研究生学位论文题录展示

基于分层模型的Deep Web查询接口集成

作 者: 陶然
导 师: 董金祥;陈刚
学 校: 浙江大学
专 业: 计算机应用技术
关键词: Deep Web 查询接口 分层模型 模式集成
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 36次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着在线数据库应用的流行,整个互联网已经被迅速地“深化”。越来越多的数据以动态生成网页的形式呈现给用户。这些必须通过填写提交查询表单才能访问的网络资源就是所谓的Deep Web。在某个用户感兴趣的领域中,不同的网站会提供各种不同的查询接口,从而导致用户不得不逐个访问该领域内的查询接口来获取自己想要的数据。为了避免这个既枯燥繁琐又费时的过程,一个有效的解决方案就是在各个不同查询接口的数据源上层建立一个虚拟的集成系统,提供给用户一个满足全局查询能力的统一的集成接口。为了达到这个目的,首先要解决的问题就是查询接口的集成。但是面对数量众多和结构各异的查询接口,基于人工或规则的集成技术显然无法适用。针对上述问题,本文提出了基于分层模型的查询接口自动集成系统QIIS(Query Interfaces Integration System)。QIIS首先使用树结构对查询接口进行分层建模,通过树结构来体现查询接口属性的物理布局所蕴含的逻辑关系,从而为属性匹配提供额外的相关信息。其次改进了进行属性匹配的过程中的相似度计算算法,引入了查询接口的结构相似度,进一步提高了属性匹配的准确率。OIIS在合并查询接口时采用了一个基于递归划分的近似最优化算法,使得最后生成的集成查询接口保持了良好的结构相关性。最后通过多个领域的测试数据证明了本方法的有效性。

全文目录


摘要  3-4
Abstract  4-10
第1章 绪论  10-22
  1.1 研究背景  10-12
  1.2 Deep Web查询接口集成主要流程  12-15
    1.2.1 Web数据库发现  13-14
    1.2.2 Web数据库分类  14
    1.2.3 查询接口模式抽取  14-15
    1.2.4 查询接口集成  15
  1.3 查询接口集成相关工作  15-19
    1.3.1 属性匹配相关工作  16-18
    1.3.2 查询接口合并相关工作  18-19
  1.4 当前研究的不足  19-20
  1.5 本文的工作和组织  20-21
  1.6 本章小结  21-22
第2章 QIIS查询接口集成系统结构  22-27
  2.1 系统框架  22-23
  2.2 QIIS模块划分  23-25
    2.2.1 查询接口预处理  23-24
    2.2.2 查询接口属性匹配  24-25
    2.2.3 查询接口合并  25
  2.3 模块间交互  25-26
  2.4 本章小结  26-27
第3章 查询接口预处理  27-33
  3.1 属性定义  27-28
  3.2 属性标准化处理  28-30
    3.2.1 分词处理  28-29
    3.2.2 转换处理  29-30
  3.3 查询接口分层建模  30-32
  3.4 本章小结  32-33
第4章 查询接口属性匹配  33-48
  4.1 属性映射介绍  33-35
    4.1.1 简单映射  33-34
    4.1.2 复杂映射  34-35
  4.2 查询属性相似度计算  35-40
    4.2.1 属性语义相似度  36-37
    4.2.2 属性值域相似度  37-39
    4.2.3 属性结构相似度  39-40
  4.3 属性映射关系生成  40-46
    4.3.1 相似度矩阵  40-41
    4.3.2 1:1映射匹配  41-43
    4.3.3 二阶段1:m映射匹配  43-46
  4.4 本章小结  46-48
第5章 查询接口合并  48-54
  5.1 最优化问题  48-50
  5.2 近似最优化合并  50-53
  5.3 本章小结  53-54
第6章 实验结果  54-62
  6.1 实验数据集  54-55
  6.2 性能评测  55-61
    6.2.1 属性匹配测试  55-59
    6.2.2 查询接口合并测试  59-61
  6.3 本章小结  61-62
第7章 总结与展望  62-64
  7.1 本文主要工作  62
  7.2 本文主要贡献  62-63
  7.3 未来工作展望  63-64
参考文献  64-68
攻读硕士学位期间主要的研究成果  68-69
致谢  69

相似论文

  1. Deep Web集成系统中同类主题数据源选择方法研究,TP311.13
  2. Deep Web数据清洗方法研究及应用,TP393.09
  3. Deep Web查询接口集成及搜索策略研究,TP393.09
  4. 基于领域知识的Deep Web接口发现研究,TP393.09
  5. Deep Web数据集成系统中数据标注研究,TP393.09
  6. Deep Web数据抽取及语义标注研究,TP393.09
  7. Deep Web数据库的选择研究,TP311.13
  8. 基于WebService的生产系统的信息集成研究,TP393.09
  9. 基于Web页面嵌套模式的包装器生成系统的设计与实现,TP393.092
  10. DWIIS系统中查询接口集成机制的研究,TP393.09
  11. Deep Web数据源发现和选择研究,TP393.09
  12. 基于DOM树的Deep Web实体抽取的研究与实现,TP393.09
  13. 基于结果模式的Deep Web数据抽取机制的研究,TP393.09
  14. 基于领域特征的两阶段查询接口抽取技术的研究与实现,TP393.09
  15. Deep Web环境下数据抽取及模式识别的研究,TP393.09
  16. Deep Web环境下查询松弛技术的研究,TP393.09
  17. 基于CPN网络的Deep Web集成系统中结果模式语义标注方法,TP393.09
  18. Deep Web下不确定数据处理的研究,TP311.13
  19. Deep Web数据源发现与采样研究,TP311.13
  20. 基于本体的深度搜索系统关键词库的构造与研究,TP391.3
  21. 空间天气预报模式集成可视化软件研究与实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com