学位论文 > 优秀研究生学位论文题录展示

基于Web视图高效查询系统的研究

作 者: 姜强
导 师: 李立新
学 校: 西南师范大学
专 业: 计算机应用技术
关键词: Web数据挖掘 查询语言 最优化查询 视图的维护 查询系统CORBA规范 B/S三层结构 代价模型 引导代数 NAGL重写规则 ADM数据模型 链接约束 包含约束
分类号: TP393.09
类 型: 硕士论文
年 份: 2004年
下 载: 86次
引 用: 0次
阅 读: 论文下载
 

内容摘要


Web网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息。进入21世纪后,随着网络的普及,电子商务的发展越来越多的引起研究者们的关注,期望在这种新型的商务模式下,利用它的诸多优点,获得更多的客户以提高收益。但是,电子商务在加速社会电子化进程的同时,也使“数据爆炸”问题进一步加剧。在茫茫的信息海洋中如何快速有效的获取所需要的有用信息,一直是困扰网上用户的难题。 Web数据挖掘可以从这个信息海洋中提取出所需要的有用知识,在一定程度上解决了用户的困扰。Web网实际上就是一个巨大的异构分布式数据库系统。为了支持高级的、健壮的和可靠的应用,在WWW上应当加强其数据库功能,引进新的机制和概念以便将数据库的功能移植到WWW上。构建这样一个Web数据查询系统,是近几年来计算机技术在电子商务领域中研究的一个热点,本文正是基于这样一个背景下开展研究的。 在本论文中,首先给出了国内外的研究现状和论文本身的意义,以及相关的理论支持。接着,考虑在Internet上Web站点的特点和Web数据多样性的特点以及网络处理的分布性,构建了一个基于Web视图的最优化查询系统模型(WebViews),并对系统中各模块的功能给予了详尽的说明,同时运用了CORBA规范集成各个模块为一个B/S三层结构的查询系统。将系统分成客户层、服务器层、和数据层。 论文接下来根据Web数据的特点,构建了一个清楚且结构良好的Web网站的关系抽象,并使用一种优化手段来转换这些关系抽象的申请查询,来设计一种导航方案。本论文使用ADM(the ARANEUS data model)数据模型的一个子集来描述Web网站。这种基于叭花b视图高效查询系统的研究摘要ADM数据模型是依靠增加链接约束来获取网站上的冗余。论文使用包含约束(i nclusionconstraini),它规定所有能被一个确定的路径访问到的页面,同样也可以使用另一条路径访问到页面。我们使用引导代数(navigational algebra)作为描述导航方案的目标语言,同时我们在研究最优化关系抽象中使用重写规则,将链接约束和包含约束引入到运算中,以便在回答查询中,减少大量需要访问的页面数量。 当根据关系视图发出一个查询时,它被重复的使用重写规则来重写,这个过程产生大量的导航方案来运算查询。这些方案的代价是根据代价模型来评估的。代价模型是用网络访问作为原始的代价参数。用这种方式,就可以查询过程选择一个高效的执行方案。 然后,论文对优化算法做了相关验证性实验,优化结果的有效性,说明了优化算法的正确性。最后是工作小结和未来展望。

全文目录


内容摘要  4-6
ABSTRACT  6-8
第一章 前言  8-13
  1.1 引言  8-9
  1.2 国内外研究领域和现状  9-10
  1.3 本论文研究的内容  10
  1.4 论文所做的工作  10-11
  1.5 论文的意义  11-12
  1.6 论文内容的安排  12-13
第二章 相关理论  13-24
  2.1 Web数据挖掘技术  13-17
    2.1.1 数据挖掘技术简介  13-14
    2.1.2 Web挖掘简介  14-15
    2.1.3 Web挖掘的分类  15-17
  2.2 NALG引导代数  17-20
  2.3 优化查询的基本理论  20-22
    2.3.1 Web的特点  20-21
    2.3.2 最优化路径表达式  21-22
    2.3.3 实例化视图  22
    2.3.4 路径约束  22
  2.4 CORBA技术概述  22-24
第三章 查询系统的系统结构及数据模型  24-39
  3.1 查询系统结构  24-25
  3.2 Web数据搜索器  25-27
    3.2.1 URL处理器  25-26
    3.2.2 协议处理器  26-27
  3.3 信息提取器  27-28
    3.3.1 重复内容检测器  27
    3.3.2 URL提取器  27-28
    3.3.3 Meta信息获取器  28
  3.4 基本关系管理器  28-29
  3.5 查询优化处理器  29-31
    3.5.1 查询表达式分析器  29-30
    3.5.2 最优化处理器  30
    3.5.3 查询评估器  30-31
  3.6 数据模型  31-37
    3.6.1 页面模式(Page-Scheme)  31-32
    3.6.2 约束(Constraints)  32-34
    3.6.3 Web模式  34-37
  3.7 运用CORBA集成系统  37-39
第四章 优化查询的策略与优化算法  39-61
  4.1 查询Web中的虚拟视图  39-41
  4.2 NALG重写规则  41-44
  4.3 代价函数  44-45
  4.4 方案的选择  45-49
  4.5 指示器连接(pointer-join)和指示器跟随(pointer-chase)  49-55
  4.6 查询实例化视图  55-61
第五章 相关实验  61-66
  5.1 实现技术及开发工具  61
  5.2 实验  61-66
第六章 小结和展望  66-67
  6.1 工作小结  66
  6.2 未来工作展望  66-67
参考文献  67-69

相似论文

  1. 海量多数据库集成系统的查询处理研究,TP311.13
  2. 中山市巡逻民警治安防控质量评价系统的开发与实现,TP311.52
  3. 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
  4. 多核环境下内存数据库查询优化的研究,TP311.13
  5. 达梦嵌入式数据库的执行计划缓存研究,TP311.13
  6. 四川职业技术学院固定资产管理信息系统设计与实现,TP311.52
  7. 面向非结构化数据查询优化的存储系统,TP333
  8. 云存储中大规模加密小文档存储管理研究与实现,TP333
  9. 达梦嵌入式数据库子查询的实现和扁平化,TP311.13
  10. RFID复杂事件实时查询处理及其优化策略,TP391.44
  11. 基于数据挖掘技术的求职招聘系统设计与实现,TP311.13
  12. 基于社交网络好友关系的图查询算法研究与应用,TP391.3
  13. 基于Web数据挖掘的个性化搜索引擎研究,TP391.3
  14. 多格式海量数据统一存取的效率优化,TP311.13
  15. 海量数据存储与全文检索,TP333
  16. 基于三层架构的网络教学平台的设计与实现,TP311.52
  17. 粒子群算法在查询优化中的应用,TP391.3
  18. 基于用户兴趣模型的个性化搜索引擎研究与分析,TP391.3
  19. 基于Web数据挖掘在个性化远程教学系统中的应用研究,TP311.13
  20. 基于ASP的动态教学评估管理系统的设计与实现,TP311.52
  21. 东营市交通协管员信息管理系统设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com