学位论文 > 优秀研究生学位论文题录展示

基于代理的元搜索引擎的研究

作 者: 王小朋
导 师: 李义杰
学 校: 辽宁工程技术大学
专 业: 计算机应用技术
关键词: 元搜索引擎 代理 信息抽取 多代理协作系统 正则表达式
分类号: TP391.3
类 型: 硕士论文
年 份: 2005年
下 载: 168次
引 用: 2次
阅 读: 论文下载
 

内容摘要


目前没有一个搜索引擎能够覆盖所有的WWW资源,而且大部分搜索引擎的索引平均只能涉及到整个WWW资源5%-20%左右。由于各个搜索引擎使用了不同的索引技术和信息收集技术,使得各自搜索的信息资源在很大程度上具有相当大的差异。实践表明,对于用户的同一查询,不同的搜索引擎会返回差异很大的查询结果。如果使用单一的搜索引擎,是不可能得到所有本可得到的资源。另外,搜索引擎在查询语法上,几乎每个搜索引擎都有所不同。这样用户为了使用这些搜索引擎,就不得不去熟悉每个搜索的搜索语法和功能。由于传统搜索引擎在这几方面的不足,而元搜索引擎又较好地解决了这些问题,所以本文把工作定位在元搜索引擎的研究上。本文阐述了基于代理的元搜索引擎的系统结构和关键技术。先介绍了搜索引擎的发展趋势和元搜索引擎的基本概念,接着介绍了代理技术和多代理系统以及多代理系统的特征、分类和交互等内容,最后提出基于代理的元搜索引擎的体系结构,并详细介绍了系统各个组成部分以及工作流程。本文设计并实现了一个基于多Agent协作系统的元搜索引擎原型系统。该系统主要由信息前处理层、查询代理层和信息后处理层组成。其中详细分析了每个搜索引擎的查询语法,尽可能地抽取大多数搜索引擎共同支持的语法格式,以XML形式定义了自己的语法规范。采用并行工作的搜索引擎代理完成与选定搜索引擎的交互,缩短了系统的响应时间。描述了现有系统的查询结果合成算法,并在此基础上,提出了一种多策略合成算法,从而提高了系统的查准率。

全文目录


1 引言  8-14
  1.1 研究动机  8-10
    1.1.1 传统独立搜索引擎的不足  8-10
    1.1.2 现有元搜索引擎的不足  10
  1.2 研究点  10-14
    1.2.1 基于代理的体系结构  10-11
    1.2.2 用户兴趣模型  11-13
    1.2.3 搜索结果的深加工  13-14
2 搜索引擎综述  14-29
  2.1 搜索引擎的基本组成  14-19
    2.1.1 一般搜索引擎的体系结构  14-17
    2.1.2 Google 的体系结构  17-19
  2.2 搜索引擎的类型  19-22
    2.2.1 目录式搜索引擎  19
    2.2.2 机器人搜索引擎  19-20
    2.2.3 集成搜索引擎  20-21
    2.2.4 元搜索引擎  21-22
    2.2.5 智能搜索引擎  22
  2.3 搜索引擎的发展方向  22-24
    2.3.1 商业化和专业化  23
    2.3.2 大型综合性搜索引擎与小型专业性搜索引擎的协调发展  23-24
    2.3.3 关键词检索与概念检索、自然语言检索协调发展  24
    2.3.4 交叉语言检索  24
  2.4 元搜索引擎  24-28
    2.4.1 元搜索引擎简介  24-26
    2.4.2 著名元搜索引擎  26-27
    2.4.3 元搜索引擎形式定义  27-28
  2.5 评价搜索引擎的技术指标  28-29
3 元搜索引擎技术  29-41
  3.1 Web 挖掘技术  29-31
    3.1.1 Web 内容挖掘  29
    3.1.2 Web 结构挖掘  29-30
    3.1.3 Web 使用挖掘  30-31
  3.2 代理技术  31-38
    3.2.1 代理技术的起源与发展  31-33
    3.2.2 代理的定义  33-37
    3.2.3 代理的结构  37-38
  3.3 多代理协作系统  38-40
    3.3.1 MAS的分类  38-39
    3.3.2 多代理的交互  39-40
  3.4 代理技术的标准化  40-41
4 系统开发解决方案  41-52
  4.1 选用基于java 的代理开发平台  41-48
    4.1.1 代理开发平台和索引检索工具  41
    4.1.2 JADE 代理开发平台介绍  41-47
    4.1.3 JADE 特点  47-48
  4.2 关键策略和算法  48-52
    4.2.1 搜索引擎调度策略  48-49
    4.2.2 搜索引擎排序算法  49-50
    4.2.3 搜索结果合成算法  50-52
5 系统的设计和实现  52-61
  5.1 基于代理的多元搜索引擎的系统结构  52-53
  5.2 查询前处理层  53-58
    5.2.1 用户交互代理  53
    5.2.2 查询扩展代理  53-56
    5.2.3 调度代理  56-58
  5.3 查询处理层  58-59
    5.3.1 检索代理  58
    5.3.2 成员代理  58-59
  5.4 查询后处理层  59
  5.5 存储层  59-61
6 本文的创新点  61-63
  6.1 设计了基于 JADE 平台的元搜索引擎的体系结构  61
  6.2 排序的有偏性  61
  6.3 摘要数据库  61-63
7 结束语  63-64
致谢  64-65
参考文献  65-66

相似论文

  1. 领域实体属性及事件抽取技术研究,TP391.1
  2. 时间表达式识别与归一化研究,TP391.1
  3. “社会代理人”:于有为和无为之间,D625
  4. 私募基金的最优投资规模,O224
  5. 基于HTTP代理的安全网关的分析和研究,TP393.08
  6. 无线传感器网络节点定位算法的研究,TN929.5
  7. 天津中远物流(天荣)公司业务流程优化与对策分析,F552
  8. 基于Y学院的人事代理制度实施研究,G647.2
  9. 基于代理商报酬合约设计的渠道控制研究,F224
  10. 表见代理疑难问题研究,D923.6
  11. 论有限责任公司中的隐名投资,D922.291.91
  12. 股权分置改革的公司治理效应,F224
  13. 夫妻共有不动产隐名共有人的权利保护,D923.2
  14. 夫妻共同债务问题的个案研究,D923.9
  15. 基于委托—代理理论的IT外包激励机制研究,F426.6
  16. 网页属性抽取的方法研究,TP391.1
  17. 认知无线电系统合作频谱感知中感知数据错误化攻击防御技术,TN925
  18. 基于S2SH框架的雅砻江虚拟研究中心系统研究与设计,TP311.52
  19. 福建电信运维操作审计系统设计与实现,TP311.52
  20. 移动代理电子商务环境下的安全迁移模型研究,TP393.08
  21. 论日常家事代理权,D923.9

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com