学位论文 > 优秀研究生学位论文题录展示
基于机器学习的深层网络接口模式匹配方法研究
作 者: 焦倩倩
导 师: 王念滨
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 深层网络 模式匹配 多策略学习技术 元学习器 领域本体
分类号: TP181
类 型: 硕士论文
年 份: 2012年
下 载: 21次
引 用: 0次
阅 读: 论文下载
内容摘要
随着万维网快速发展,深层网络中蕴含的信息日益增加。由于深层网络具有规模大、异构性、自治性等特点,如何使用户高效、快捷地获取自己满意的信息面临挑战。为了解决这一问题,需要对深层网络查询接口进行集成。深层网络查询接口集成包括若干步骤,但其中至关重要的一步是接口间模式匹配。只有实现了该匹配过程,才能对查询接口模式进行集成,最终得到一个全局查询接口。用户在全局查询接口上提交所要查询的信息,屏蔽掉与搜索无关的细节,得到最满意的查询结果。本文主要研究深层网络接口模式匹配问题,深层网络接口模式匹配的目的是找到局部查询接口之间的属性或是局部查询接口与全局查询接口之间的属性的最佳匹配关系,以解决查询接口之间存在的同名异义或异名同义的现象。目前解决深层网络查询接口模式匹配的方法有很多,现有的方法大多是针对局部查询接口之间的模式匹配进行研究,并且忽略了深层网络本身的特点。本文针对局部查询接口与全局查询接口之间的模式匹配进行研究,同时利用了深层网络的特点,提出了基于机器学习的深层网络接口模式匹配方法,该方法把模式匹配问题转化成了机器学习中的分类问题。本文使用集成学习中的多策略学习技术,研究已经证明多策略学习技术比单一的学习器准确度要高。同时,本文为了增强匹配的准确度,在训练阶段和匹配阶段均引入领域本体的概念,丰富了属性的匹配信息,提高了匹配的准确度。除此之外,本文考虑到查询接口中往往包含丰富的结构信息,为了充分利用层次结构树信息,提出了一种新的学习器算法,该过程能够有效的纠正了前一个阶段的匹配结果,使得匹配准确度进一步提高。为了评估基于机器学习的深层网络查询接口模式匹配的执行情况,本文分别以图书销售领域和航空订票领域的120个数据源作为训练集,40个数据源作为待匹配模式集进行实验验证,实验结果表明,该方法有较高的准确度。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-21 1.1 课题研究背景及意义 10-12 1.1.1 课题的背景 10-11 1.1.2 课题的意义 11-12 1.2 国内外研究现状 12-19 1.2.1 深层网络的研究现状 12-15 1.2.2 机器学习中分类问题的研究现状 15-16 1.2.3 深层网络模式匹配的研究现状 16-19 1.3 主要研究内容 19-20 1.4 本文的组织结构 20-21 第2章 深层网络查询接口模式匹配相关研究 21-29 2.1 深层网络查询接口简要介绍 21-22 2.2 模式匹配 22-26 2.2.1 传统模式匹配的方法分类 23-25 2.2.2 深层网络中模式匹配的分类 25-26 2.3 深层网络查询接口模式匹配主要问题 26-28 2.3.1 查询接口模式匹配面对的主要问题 26-27 2.3.2 查询接口模式匹配的出发点 27-28 2.4 本章小结 28-29 第3章 基于机器学习的深层网络接口模式匹配方法 29-45 3.1 研究概述 29-30 3.2 查询接口模式匹配框架 30 3.3 查询接口数据准备 30-33 3.3.1 查询接口的抽取和 XML DTD 表示形式 30-32 3.3.2 领域本体 32-33 3.3.3 查询接口模式属性预处理 33 3.4 查询接口属性的匹配 33-42 3.4.1 一些基本概念 33-34 3.4.2 作为分类问题的模式匹配 34-35 3.4.3 训练阶段 35-39 3.4.4 匹配阶段 39-41 3.4.5 算法实现 41-42 3.5 结构学习器 42-43 3.6 本章小结 43-45 第4章 查询接口模式匹配的设计实现 45-55 4.1 查询接口模式匹配的总体目标 45 4.2 查询接口模式匹配的体系结构 45-46 4.3 查询接口模式匹配的具体实施的策略 46-54 4.3.1 数据处理 46-50 4.3.2 训练阶段 50-51 4.3.3 匹配阶段 51-53 4.3.4 结构学习器 53-54 4.4 本章小结 54-55 第5章 实验及结果分析 55-59 5.1 数据集的选择 55 5.2 实验衡量标准 55 5.3 实验结果及分析 55-58 5.4 本文提出方法总结 58 5.5 本章小结 58-59 结论 59-60 参考文献 60-65 致谢 65
|
相似论文
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- 基于查询接口的Deep Web模式匹配方法研究,TP311.13
- 基于领域本体的专利地图研究,TP391.1
- 基于本体的食品投诉文档文本分类研究,TP391.1
- 一个基于模式匹配的轻量级网络入侵检测系统设计与实现,TP393.08
- Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
- 面向不确定感知数据的异常数据检测技术,TN929.5
- 深层网络信息发掘技术研究,TP393.09
- 网络数据源模式识别方法及策略研究,TP311.13
- 深层网络信息资源集成模式的类型与选择,G350
- 基于本体的深层网络模式匹配研究,TP311.13
- 多核技术在网络入侵检测中的应用研究,TP393.08
- 基于深度包检测技术入侵检测系统设计与实现,TP393.08
- 基于校园网的入侵检测系统设计与研究,TP393.18
- 基于领域本体的产生式框架知识表示的研究及其应用,TP182
- 基于本体的语言学文献分类研究,H0
- 面向航空领域的本体设计及应用,V37
- 基于DTW模型的孤立词语音识别算法实现研究,TN912.34
- 大规模图数据库上的模式匹配,TP311.13
- 网络入侵检测中多模式匹配算法研究,TP393.08
- 汉语普通话中双音节词水平测试系统的设计与研究,TN912.34
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|