学位论文 > 优秀研究生学位论文题录展示

基于本体及概念模式的Deep Web查询结果处理技术

作 者: 阚述贤
导 师: 王驹
学 校: 广西师范大学
专 业: 计算机软件与理论
关键词: 深网 领域本体 概念模式 信息抽取 数据融合 信息集成
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 25次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着World Wide Web的飞速发展,其中蕴含了海量的信息可供我们利用。整个Web看似庞然无序,但按其蕴涵信息的“深度”,可以将其划分为Surface Web和Deep Web两大部分。相比Surface Web, Deep Web具有信息量更大、信息质量更好、主题更专一以及结构性更强等特点。目前,关于Deep Web信息集成的研究越来越受到关注,而Deep Web查询结果处理技术正是这项研究的核心内容之一。从对Deep Web数据集成的现状分析可知,尽管本体很早就应用于语义Web中,但其在Deep Web数据集成系统中的实际应用效果并没有得到很好的体现。本文研究的Deep Web查询结果处理系统属于Deep Web数据集成系统的一个子系统,该系统在原有研究成果的基础上做了很大的改进,不仅把领域本体技术应用到系统中,并引入了概念模式和结果模式等计算机领域前沿技术,而且还对系统进行了科学详细的设计,把这些前沿技术合理地融入到系统中去,有效解决了异构数据之间的融合问题。论文主要的研究工作以及创新点如下:(1)本文重点介绍了本体相关知识并分析了领域本体的组成结构,根据领域本体的构建方法,并结合旅游领域相关Web数据库的结果记录的特征,以OWL 2作为编码语言,构建了旅游领域本体。(2)本文提出了一种基于概念模式的Deep Web查询结果处理技术,通过样本查询生成结果模式,能够对源于不同Web数据库的异构结果记录进行规范,使查询得来的数据在概念式下变得统一规范,这样使得对结果记录的合并、排序、去重以及进一步处理与利用变得十分方便。(3)本文介绍了属性、概念以及实例的相似度计算方法,并结合本体中概念的层次特点与语义关系,对相似度计算方法进行了适当的改进,大大提高了模式匹配的准确率,从而达到提升结果融合效果的目的。(4)本文在前人研究的基础上,对面向旅游领域的Deep Web查询结果处理系统进行详细设计和科学改进,把领域本体和结果模式等技术合理地融入到系统中去,从而大大改善了系统的性能。

全文目录


摘要  3-4
Abstract  4-6
目录  6-8
第1章 绪论  8-15
  1.1 研究背景  8-9
  1.2 相关理论与技术介绍  9-13
    1.2.1 Deep Web信息集成技术  9-11
    1.2.2 基于本体的信息集成技术  11-13
  1.3 论文内容  13-14
  1.4 论文结构  14-15
第2章 本体  15-30
  2.1 本体理论介绍  15-18
    2.1.1 本体的定义  15-16
    2.1.2 本体的分类  16-17
    2.1.3 本体描述语言  17-18
  2.2 构建领域本体  18-26
    2.2.1 领域本体的构建准则  18-19
    2.2.2 领域本体的构建方法  19-21
    2.2.3 基于旅游领域的本体构建  21-26
  2.3 语义标注  26-29
    2.3.1 语义标注观点  26-27
    2.3.2 语义标注对象  27-28
    2.3.3 语义标注工具和方法  28-29
  2.4 小结  29-30
第3章 概念模式  30-39
  3.1 概念模式与结果模式的定义  30
  3.2 概念模式集成  30-32
  3.3 概念模式规范  32-34
  3.4 语义相似度计算  34-37
    3.4.1 属性相似度  34-35
    3.4.2 概念相似度  35-36
    3.4.3 实例相似度  36-37
  3.5 小结  37-39
第4章 Deep Web查询结果处理系统的设计  39-50
  4.1 系统结构  39-40
  4.2 结果模式生成模块  40-41
  4.3 结果处理模块  41-44
    4.3.1 结果抽取模块  42-43
    4.3.2 结果注释模块  43
    4.3.3 结果融合模块  43-44
  4.4 性能分析  44-49
  4.5 小结  49-50
第5章 总结与展望  50-51
参考文献  51-53
读研期间发表的论文  53-54
致谢  54-55

相似论文

  1. 基于微型无人平台导航多传感器信息融合算法研究,V249.32
  2. 多传感器组网及反隐身、抗干扰接力跟踪技术研究,TN953
  3. 海量多数据库集成系统的Mediator和Wrapper机制的设计与实现,TP311.13
  4. 领域实体属性及事件抽取技术研究,TP391.1
  5. 时间表达式识别与归一化研究,TP391.1
  6. 医疗信息集成平台中HL7消息解析和存储的设计与实现,TP311.52
  7. 医疗信息集成平台中DICOM中间件及访问控制模型的设计与实现,TP311.13
  8. 海上平台消防系统研究,U698.4
  9. A公司信息化管理优化研究,TP315
  10. 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
  11. 无线传感器网络数据融合算法及模型研究,TN929.5
  12. 基于Web挖掘技术研究及其在数字图书馆中的应用,G250.76
  13. 网页属性抽取的方法研究,TP391.1
  14. 基于领域本体的海洋环境数据仓库设计,TP311.13
  15. 数据空间中数据资源之间关联关系发现模型研究,TP311.13
  16. 高校信息集成平台的设计与实现,TP311.52
  17. 基于视频的动物运动跟踪分析系统及应用研究,TP391.41
  18. 基于服务总线的模具企业信息集成系统,TP311.52
  19. 无线传感器网络数据融合技术的相关研究,TN929.5
  20. 多传感器网络数据融合技术的研究,TN929.5;TP202
  21. 基于通信约束的无线传感器网络的研究,TN929.5

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com