学位论文 > 优秀研究生学位论文题录展示
元搜索引擎调度策略及结果排序算法的研究
作 者: 王金栋
导 师: 原福永
学 校: 燕山大学
专 业: 计算机应用技术
关键词: 元搜索引擎 查询扩展 元搜索引擎的调度策略 排序算法 搜索精度
分类号: TP391.3
类 型: 硕士论文
年 份: 2010年
下 载: 149次
引 用: 2次
阅 读: 论文下载
内容摘要
随着互联网的蓬勃发展,网上信息资源呈几何级数的速度增长。搜索引擎的出现帮助广大网民迅速定位到自己想要的信息,节省了用户在漫无边际的网络中查找信息的时间,但是单个搜索引擎的覆盖率却随着网络信息的快速增长而开始下降。为了提高搜索的覆盖范围,元搜索引擎应运而生。元搜索引擎是利用现有的独立搜索引擎的查询性能,将它们看作一个整体,为用户提供一个统一的查询界面并返回结果。本文在综合分析国内外有关元搜索引擎排序技术的基础上,对如何提高元搜索引擎精度进行了深入的研究。首先,介绍了独立搜索引擎和元搜索引擎中一些相关的基础知识,并在此基础上深入地分析了元搜索引擎存在的必要性以及当前存在的不足。针对用户查询信息不足的问题,提出一种基于元搜索引擎的查询扩展的方法,利用该方法对用户的查询词进行扩展,然后选取与原查询词贴近度最大的几个扩展词,进行输入并按照一定的排序算法返回结果。其次,元搜索引擎的调度策略是元搜索引擎的关键技术,在对已有的一些调度算法介绍并分析的基础上,提出一种新的元搜索引擎的调度方法,该方法从系统和用户两方面入手,系统按照一定的方法选择出系统认为是最重要的几个通用搜索引擎,用户则从主观上挑选出几个优秀的专业搜索引擎,按此方法对独立搜索引擎进行调度。并通过实验对提出的调度方法进行验证。最后,针对元搜索引擎如何进一步提高搜索精度的问题,在介绍和分析当前一些主要的结果排序算法的基础上,提出一种基于位置/网页摘要与标题相结合的排序算法来对元搜索引擎结果进行合并,并最终通过实验对所提出的算法的有效性进行了验证。
|
全文目录
摘要 5-7 ABSTRACT 7-12 第1章 绪论 12-19 1.1 研究背景 12-13 1.2 研究意义 13-14 1.2.1 传统搜索引擎的局限性 13 1.2.2 元搜索引擎的优势 13-14 1.3 元搜索引擎的研究现状 14-17 1.4 本文研究内容 17 1.5 本文的组织结构 17-19 第2章 搜索引擎概述 19-31 2.1 引言 19 2.2 搜索引擎的分类 19-22 2.3 独立搜索引擎 22-24 2.3.1 搜索引擎的结构和原理 22-24 2.3.2 搜索引擎的评价指标 24 2.4 元搜索引擎 24-29 2.4.1 元搜索引擎的工作原理和架构 24-25 2.4.2 元搜索引擎分类 25-27 2.4.3 元搜索引擎的评价指标 27-28 2.4.4 元搜索引擎未来的发展趋势 28-29 2.5 元搜索引擎与独立搜索引擎的比较 29-30 2.6 本章小结 30-31 第3章 查询扩展研究 31-40 3.1 基于局部信息的查询扩展 31-33 3.1.1 基于局部聚类的查询扩展 31-32 3.1.2 基于局部上下文的查询扩展 32-33 3.2 基于全局分析的查询扩展 33-34 3.2.1 基于相似词典的查询扩展 33 3.2.2 基于统计词典的查询扩展 33-34 3.3 一种基于元搜索引擎的查询扩展的方法 34-37 3.3.1 扩展源的选定 34-35 3.3.2 查询扩展词权重的赋值 35-37 3.4 实验验证 37-39 3.4.1 实验环境 37-38 3.4.2 实验结果分析 38-39 3.5 本章小结 39-40 第4章 元搜索引擎的调度策略的研究 40-53 4.1 元搜索引擎的调度策略 40-44 4.1.1 普通方法 41 4.1.2 定性方法 41-43 4.1.3 定量方法 43-44 4.1.4 基于学习法 44 4.2 一种新的元搜索引擎的调度方法 44-50 4.2.1 调度方法的思想 44-46 4.2.2 调度方法的具体实施步骤 46-47 4.2.3 调度方法的超时问题处理 47-49 4.2.4 调度方法中术语集更新问题 49-50 4.3 实验验证 50-51 4.3.1 实验平台 50-51 4.3.2 实验结果分析 51 4.4 本章小结 51-53 第5章 元搜索引擎结果排序算法的研究 53-68 5.1 常见的结果排序算法 53-58 5.2 基于位置/网页摘要和标题的排序算法 58-65 5.2.1 元搜索引擎的结果去重 58-59 5.2.2 过滤广告网页 59-60 5.2.3 位置/网页摘要和标题排序法 60-65 5.3 实验验证 65-67 5.3.1 实验环境 65 5.3.2 实验结果分析 65-67 5.4 本章小结 67-68 结论 68-70 参考文献 70-75 致谢 75-76 作者简介 76
|
相似论文
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 网络搜索引擎的相关技术研究,G354
- 基于Agent元搜索引擎的个性化研究,TP391.3
- 基于链接结构分析的Web页面排序算法,TP393.092
- 汉英跨语言网址搜索引擎的设计与实现,TP391.3
- 基于元搜索的Web网络军事情报信息搜索技术研究,TP391.3
- 一个基于向量空间模型的个性化推荐系统,TP391.3
- 基于Web的中文元搜索引擎的研究及实现,TP391.3
- 蜜蜂进化型遗传算法的改进和应用研究,TP18
- 面向农业领域的垂直搜索技术的研究,TP391.3
- 基于本体的个性化元搜索引擎研究,TP391.3
- 基于Linux图形交互式线切割CAM软件实现技术研究,TG484
- 基于用户模型的个性化元搜索引擎的研究与设计,TP391.3
- 元搜索引擎中域语义映射问题研究,TP391.3
- 个性化元搜索引擎的分析与研究,TP391.3
- 基于Lucene技术的垂直搜索引擎的研究与实现,TP391.3
- 基于GPU微体系结构的高性能计算研究,TP338
- 基于博文分布特征的博客精选技术研究,TP393.092
- 基于用户反馈的搜索引擎排名算法研究,TP391.3
- 基于Hibernate的数据维护工具的研究与应用,TP311.52
- 基于Lucene的Web搜索引擎的研究,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|