学位论文 > 优秀研究生学位论文题录展示
基于领域本体的Deep Web不确定性模式匹配研究
作 者: 高华玲
导 师: 王驹
学 校: 广西师范大学
专 业: 计算机软件与理论
关键词: 深网 领域本体 相似度 模式匹配 不确定性
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 20次
引 用: 0次
阅 读: 论文下载
内容摘要
随着互联网技术的不断发展,出现越来越多的网络信息资源,如何利用的问题引起广大网民和学术研究人员的关注。根据Web的信息资源的分布和位置特征可以将其划分为Surface Web与Deep Web两部分。传统的搜索引擎仅能检索Surface Web信息,而对于信息量更大、信息质量更好、主题更专一、结构性更强的Deep Web数据库信息却不能有效的爬取。Deep Web信息集成是有效利用Deep Web信息资源的重要手段。Deep Web查询接口集成的研究是信息集成研究的核心内容,有着重要的“承上启下”的作用。目前的查询接口集成研究存在一些问题:中文语义计算不够准确、查询接口模式匹配的方法复杂、时间复杂度较大、模式匹配的不确定性考虑不多等。针对这些缺点和不足,本文提出一种基于领域本体的查询接口集成方法,该方法是一种整体匹配方法,打破了传统的两两匹配方法在效率上的瓶颈,大大简化了匹配的复杂过程。同时提出一种不确定性匹配的选择标准,为不确定性匹配的研究开拓了新的思路。本文主要的研究工作和贡献概括如下:(1)本文重点介绍了本体相关知识并分析了领域本体的组成结构,根据领域本体的构建方法并结合旅游领域相关Deep Web查询接口属性和实例特征,使用更规范的、表达能力更强的本体语言OWL2作为编码语言,构建了面向查询接口的旅游领域本体。(2)本文在深入研究和分析传统模式匹配技术基础上,提出了一种基于领域本体的Deep Web查询接口模式匹配方法,利用该方法实现了对特定领域的大量查询接口的整体匹配,匹配效率上大大优于传统的两两匹配。该方法充分的利用了本体概念与概念之间的语义关系,实现了查询接口在语义级别上的理解。(3)本文对模式匹配中最重要的相似度计算问题提出了一种改进的属性相似度计算方法。该方法用于中文查询接口集成中的模式匹配问题,考虑到中文查询接口属性名称出现的规律和特点,在基于知网的中文语义相似度计算的基础上改进了属性相似度计算的公式。实验证明使用该公式大大提高了计算的准确率。(4)本文对不确定性模式匹配的评价提出了基于属性位置判断属性匹配可信度的观点,并给出了属性匹配可信度量化的计算公式,帮助我们选择更合理的匹配结果。(5)本文实现了基于本体的查询接口集成系统,包括本体管理模块、查询接口预处理模块、相似度计算模块、模式匹配生成模块和查询接口集成模块。在系统实现的基础上评估并验证了本文的关键技术和算法,为实验结果数据的收集创造了良好的平台。最后,通过建立的系统平台,设置相应的实验,对实验结果进行分析与评价,验证了基于本体的模式匹配方法的性能特点和改进的属性相似度计算方法的准确率。
|
全文目录
摘要 3-5 ABSTRACT 5-9 第1章 绪论 9-12 1.1 课题来源和意义 9 1.2 Deep Web数据集成研究现状 9-10 1.3 论文研究内容 10-11 1.4 论文结构安排 11-12 第2章 领域本体构建 12-22 2.1 本体相关知识 12-15 2.1.1 本体定义 12-13 2.1.2 本体描述语言及分类 13 2.1.3 领域本体构建原则和方法 13-15 2.2 面向Deep Web查询接口的领域本体构建 15-21 2.2.1 确定领域本体的专业范畴 15 2.2.2 获取领域术语集合 15-16 2.2.3 定义类层次关系 16-19 2.2.4 领域本体形式化编码 19-21 2.3 本章小结 21-22 第3章 模式匹配 22-31 3.1 模式匹配技术 22-29 3.1.1 模式匹配基本技术 22-25 3.1.2 模式匹配技术分类 25-27 3.1.3 Deep Web查询接口匹配的特点 27-28 3.1.4 Deep Web查询接口匹配的方法 28-29 3.2 模式匹配的不确定性 29-30 3.2.1 不确定性产生的原因 29-30 3.2.2 不确定性模式匹配研究 30 3.3 本章小结 30-31 第4章 Deep Web查询接口集成 31-44 4.1 基于本体的查询接口模式匹配方法 31-39 4.1.1 基于本体的模式匹配基本过程 32-34 4.1.2 基于本体的模式匹配算法 34-38 4.1.3 查询接口的集成 38-39 4.2 语义相似度计算 39-40 4.3 语义冲突和不确定性匹配 40-43 4.3.1 属性相似度计算的改进 40-42 4.3.2 不确定模式匹配的选取 42-43 4.4 本章小结 43-44 第5章 查询接口集成系统及实验结果 44-51 5.1 Deep Web查询接口集成系统实现 44-47 5.2 实验及结果分析 47-50 5.2.1 实验数据采集 47 5.2.2 性能评价标准 47-48 5.2.3 实验结果分析 48-50 5.3 本章小结 50-51 第6章 总结与展望 51-53 6.1 工作总结 51 6.2 研究前景展望 51-53 参考文献 53-59 攻读硕士学位期间公开发表的论文和参与的科研项目 59-60 致谢 60-61
|
相似论文
- 小型望远镜防抖系统的设计与工程实现,TH743
- 基于句法特征的代词消解方法研究,TP391.1
- 多邮件自动文摘的关键技术研究,TP391.1
- 离散切换系统稳定性分析及控制器设计,TP13
- 随机时滞系统的稳定性分析与鲁棒控制器设计,TP13
- 时滞系统的稳定性分析,TP13
- 污染场地健康与生态风险评价研究,X820.4
- 基于相似度计算的编程题自动评判方法研究,TP312.1
- 基于不确定性系统研究方法的高校学生学习成绩分析与预测,G642.4
- 不确定性和元小说:《马赛克人》的后现代主义特点研究,I712.074
- 信息规避研究,G201
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 微粒群算法的改进与应用研究,TP18
- 论《第二十二条军规》中的不确定性,I712.074
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
- 不确定广义系统的鲁棒无源控制,TP13
- 熵在经济预测模型评价中的应用,F201
- 仿射不确定广义系统的鲁棒耗散性分析及控制,TP13
- 智能答疑系统中句子相似度计算的研究与应用,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|