学位论文 > 优秀研究生学位论文题录展示
基于代理的元搜索引擎的研究
作 者: 王小朋
导 师: 李义杰
学 校: 辽宁工程技术大学
专 业: 计算机应用技术
关键词: 元搜索引擎 代理 信息抽取 多代理协作系统 正则表达式
分类号: TP391.3
类 型: 硕士论文
年 份: 2005年
下 载: 168次
引 用: 2次
阅 读: 论文下载
内容摘要
目前没有一个搜索引擎能够覆盖所有的WWW资源,而且大部分搜索引擎的索引平均只能涉及到整个WWW资源5%-20%左右。由于各个搜索引擎使用了不同的索引技术和信息收集技术,使得各自搜索的信息资源在很大程度上具有相当大的差异。实践表明,对于用户的同一查询,不同的搜索引擎会返回差异很大的查询结果。如果使用单一的搜索引擎,是不可能得到所有本可得到的资源。另外,搜索引擎在查询语法上,几乎每个搜索引擎都有所不同。这样用户为了使用这些搜索引擎,就不得不去熟悉每个搜索的搜索语法和功能。由于传统搜索引擎在这几方面的不足,而元搜索引擎又较好地解决了这些问题,所以本文把工作定位在元搜索引擎的研究上。本文阐述了基于代理的元搜索引擎的系统结构和关键技术。先介绍了搜索引擎的发展趋势和元搜索引擎的基本概念,接着介绍了代理技术和多代理系统以及多代理系统的特征、分类和交互等内容,最后提出基于代理的元搜索引擎的体系结构,并详细介绍了系统各个组成部分以及工作流程。本文设计并实现了一个基于多Agent协作系统的元搜索引擎原型系统。该系统主要由信息前处理层、查询代理层和信息后处理层组成。其中详细分析了每个搜索引擎的查询语法,尽可能地抽取大多数搜索引擎共同支持的语法格式,以XML形式定义了自己的语法规范。采用并行工作的搜索引擎代理完成与选定搜索引擎的交互,缩短了系统的响应时间。描述了现有系统的查询结果合成算法,并在此基础上,提出了一种多策略合成算法,从而提高了系统的查准率。
|
全文目录
1 引言 8-14 1.1 研究动机 8-10 1.1.1 传统独立搜索引擎的不足 8-10 1.1.2 现有元搜索引擎的不足 10 1.2 研究点 10-14 1.2.1 基于代理的体系结构 10-11 1.2.2 用户兴趣模型 11-13 1.2.3 搜索结果的深加工 13-14 2 搜索引擎综述 14-29 2.1 搜索引擎的基本组成 14-19 2.1.1 一般搜索引擎的体系结构 14-17 2.1.2 Google 的体系结构 17-19 2.2 搜索引擎的类型 19-22 2.2.1 目录式搜索引擎 19 2.2.2 机器人搜索引擎 19-20 2.2.3 集成搜索引擎 20-21 2.2.4 元搜索引擎 21-22 2.2.5 智能搜索引擎 22 2.3 搜索引擎的发展方向 22-24 2.3.1 商业化和专业化 23 2.3.2 大型综合性搜索引擎与小型专业性搜索引擎的协调发展 23-24 2.3.3 关键词检索与概念检索、自然语言检索协调发展 24 2.3.4 交叉语言检索 24 2.4 元搜索引擎 24-28 2.4.1 元搜索引擎简介 24-26 2.4.2 著名元搜索引擎 26-27 2.4.3 元搜索引擎形式定义 27-28 2.5 评价搜索引擎的技术指标 28-29 3 元搜索引擎技术 29-41 3.1 Web 挖掘技术 29-31 3.1.1 Web 内容挖掘 29 3.1.2 Web 结构挖掘 29-30 3.1.3 Web 使用挖掘 30-31 3.2 代理技术 31-38 3.2.1 代理技术的起源与发展 31-33 3.2.2 代理的定义 33-37 3.2.3 代理的结构 37-38 3.3 多代理协作系统 38-40 3.3.1 MAS的分类 38-39 3.3.2 多代理的交互 39-40 3.4 代理技术的标准化 40-41 4 系统开发解决方案 41-52 4.1 选用基于java 的代理开发平台 41-48 4.1.1 代理开发平台和索引检索工具 41 4.1.2 JADE 代理开发平台介绍 41-47 4.1.3 JADE 特点 47-48 4.2 关键策略和算法 48-52 4.2.1 搜索引擎调度策略 48-49 4.2.2 搜索引擎排序算法 49-50 4.2.3 搜索结果合成算法 50-52 5 系统的设计和实现 52-61 5.1 基于代理的多元搜索引擎的系统结构 52-53 5.2 查询前处理层 53-58 5.2.1 用户交互代理 53 5.2.2 查询扩展代理 53-56 5.2.3 调度代理 56-58 5.3 查询处理层 58-59 5.3.1 检索代理 58 5.3.2 成员代理 58-59 5.4 查询后处理层 59 5.5 存储层 59-61 6 本文的创新点 61-63 6.1 设计了基于 JADE 平台的元搜索引擎的体系结构 61 6.2 排序的有偏性 61 6.3 摘要数据库 61-63 7 结束语 63-64 致谢 64-65 参考文献 65-66
|
相似论文
- 领域实体属性及事件抽取技术研究,TP391.1
- 时间表达式识别与归一化研究,TP391.1
- “社会代理人”:于有为和无为之间,D625
- 私募基金的最优投资规模,O224
- 基于HTTP代理的安全网关的分析和研究,TP393.08
- 无线传感器网络节点定位算法的研究,TN929.5
- 天津中远物流(天荣)公司业务流程优化与对策分析,F552
- 基于Y学院的人事代理制度实施研究,G647.2
- 基于代理商报酬合约设计的渠道控制研究,F224
- 表见代理疑难问题研究,D923.6
- 论有限责任公司中的隐名投资,D922.291.91
- 股权分置改革的公司治理效应,F224
- 夫妻共有不动产隐名共有人的权利保护,D923.2
- 夫妻共同债务问题的个案研究,D923.9
- 基于委托—代理理论的IT外包激励机制研究,F426.6
- 网页属性抽取的方法研究,TP391.1
- 认知无线电系统合作频谱感知中感知数据错误化攻击防御技术,TN925
- 基于S2SH框架的雅砻江虚拟研究中心系统研究与设计,TP311.52
- 福建电信运维操作审计系统设计与实现,TP311.52
- 移动代理电子商务环境下的安全迁移模型研究,TP393.08
- 论日常家事代理权,D923.9
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|