学位论文 > 优秀研究生学位论文题录展示
基于Web视图高效查询系统的研究
作 者: 姜强
导 师: 李立新
学 校: 西南师范大学
专 业: 计算机应用技术
关键词: Web数据挖掘 查询语言 最优化查询 视图的维护 查询系统CORBA规范 B/S三层结构 代价模型 引导代数 NAGL重写规则 ADM数据模型 链接约束 包含约束
分类号: TP393.09
类 型: 硕士论文
年 份: 2004年
下 载: 86次
引 用: 0次
阅 读: 论文下载
内容摘要
Web网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息。进入21世纪后,随着网络的普及,电子商务的发展越来越多的引起研究者们的关注,期望在这种新型的商务模式下,利用它的诸多优点,获得更多的客户以提高收益。但是,电子商务在加速社会电子化进程的同时,也使“数据爆炸”问题进一步加剧。在茫茫的信息海洋中如何快速有效的获取所需要的有用信息,一直是困扰网上用户的难题。 Web数据挖掘可以从这个信息海洋中提取出所需要的有用知识,在一定程度上解决了用户的困扰。Web网实际上就是一个巨大的异构分布式数据库系统。为了支持高级的、健壮的和可靠的应用,在WWW上应当加强其数据库功能,引进新的机制和概念以便将数据库的功能移植到WWW上。构建这样一个Web数据查询系统,是近几年来计算机技术在电子商务领域中研究的一个热点,本文正是基于这样一个背景下开展研究的。 在本论文中,首先给出了国内外的研究现状和论文本身的意义,以及相关的理论支持。接着,考虑在Internet上Web站点的特点和Web数据多样性的特点以及网络处理的分布性,构建了一个基于Web视图的最优化查询系统模型(WebViews),并对系统中各模块的功能给予了详尽的说明,同时运用了CORBA规范集成各个模块为一个B/S三层结构的查询系统。将系统分成客户层、服务器层、和数据层。 论文接下来根据Web数据的特点,构建了一个清楚且结构良好的Web网站的关系抽象,并使用一种优化手段来转换这些关系抽象的申请查询,来设计一种导航方案。本论文使用ADM(the ARANEUS data model)数据模型的一个子集来描述Web网站。这种基于叭花b视图高效查询系统的研究摘要ADM数据模型是依靠增加链接约束来获取网站上的冗余。论文使用包含约束(i nclusionconstraini),它规定所有能被一个确定的路径访问到的页面,同样也可以使用另一条路径访问到页面。我们使用引导代数(navigational algebra)作为描述导航方案的目标语言,同时我们在研究最优化关系抽象中使用重写规则,将链接约束和包含约束引入到运算中,以便在回答查询中,减少大量需要访问的页面数量。 当根据关系视图发出一个查询时,它被重复的使用重写规则来重写,这个过程产生大量的导航方案来运算查询。这些方案的代价是根据代价模型来评估的。代价模型是用网络访问作为原始的代价参数。用这种方式,就可以查询过程选择一个高效的执行方案。 然后,论文对优化算法做了相关验证性实验,优化结果的有效性,说明了优化算法的正确性。最后是工作小结和未来展望。
|
全文目录
内容摘要 4-6 ABSTRACT 6-8 第一章 前言 8-13 1.1 引言 8-9 1.2 国内外研究领域和现状 9-10 1.3 本论文研究的内容 10 1.4 论文所做的工作 10-11 1.5 论文的意义 11-12 1.6 论文内容的安排 12-13 第二章 相关理论 13-24 2.1 Web数据挖掘技术 13-17 2.1.1 数据挖掘技术简介 13-14 2.1.2 Web挖掘简介 14-15 2.1.3 Web挖掘的分类 15-17 2.2 NALG引导代数 17-20 2.3 优化查询的基本理论 20-22 2.3.1 Web的特点 20-21 2.3.2 最优化路径表达式 21-22 2.3.3 实例化视图 22 2.3.4 路径约束 22 2.4 CORBA技术概述 22-24 第三章 查询系统的系统结构及数据模型 24-39 3.1 查询系统结构 24-25 3.2 Web数据搜索器 25-27 3.2.1 URL处理器 25-26 3.2.2 协议处理器 26-27 3.3 信息提取器 27-28 3.3.1 重复内容检测器 27 3.3.2 URL提取器 27-28 3.3.3 Meta信息获取器 28 3.4 基本关系管理器 28-29 3.5 查询优化处理器 29-31 3.5.1 查询表达式分析器 29-30 3.5.2 最优化处理器 30 3.5.3 查询评估器 30-31 3.6 数据模型 31-37 3.6.1 页面模式(Page-Scheme) 31-32 3.6.2 约束(Constraints) 32-34 3.6.3 Web模式 34-37 3.7 运用CORBA集成系统 37-39 第四章 优化查询的策略与优化算法 39-61 4.1 查询Web中的虚拟视图 39-41 4.2 NALG重写规则 41-44 4.3 代价函数 44-45 4.4 方案的选择 45-49 4.5 指示器连接(pointer-join)和指示器跟随(pointer-chase) 49-55 4.6 查询实例化视图 55-61 第五章 相关实验 61-66 5.1 实现技术及开发工具 61 5.2 实验 61-66 第六章 小结和展望 66-67 6.1 工作小结 66 6.2 未来工作展望 66-67 参考文献 67-69
|
相似论文
- 海量多数据库集成系统的查询处理研究,TP311.13
- 中山市巡逻民警治安防控质量评价系统的开发与实现,TP311.52
- 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
- 多核环境下内存数据库查询优化的研究,TP311.13
- 达梦嵌入式数据库的执行计划缓存研究,TP311.13
- 四川职业技术学院固定资产管理信息系统设计与实现,TP311.52
- 面向非结构化数据查询优化的存储系统,TP333
- 云存储中大规模加密小文档存储管理研究与实现,TP333
- 达梦嵌入式数据库子查询的实现和扁平化,TP311.13
- RFID复杂事件实时查询处理及其优化策略,TP391.44
- 基于数据挖掘技术的求职招聘系统设计与实现,TP311.13
- 基于社交网络好友关系的图查询算法研究与应用,TP391.3
- 基于Web数据挖掘的个性化搜索引擎研究,TP391.3
- 多格式海量数据统一存取的效率优化,TP311.13
- 海量数据存储与全文检索,TP333
- 基于三层架构的网络教学平台的设计与实现,TP311.52
- 粒子群算法在查询优化中的应用,TP391.3
- 基于用户兴趣模型的个性化搜索引擎研究与分析,TP391.3
- 基于Web数据挖掘在个性化远程教学系统中的应用研究,TP311.13
- 基于ASP的动态教学评估管理系统的设计与实现,TP311.52
- 东营市交通协管员信息管理系统设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|