学位论文 > 优秀研究生学位论文题录展示

个性化元搜索引擎关键技术的研究

作 者: 李磊
导 师: 胡文江
学 校: 内蒙古科技大学
专 业: 计算机应用技术
关键词: 元搜索引擎 个性化搜索 调度策略 多级排序 相关度 结果整合
分类号: TP391.3
类 型: 硕士论文
年 份: 2013年
下 载: 19次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网中信息量的快速增长,浩如烟海的信息世界具有无组织,分布广、结构复杂、动态变化等特点,搜索引擎作为信息检索工具成为人们生活中必不可少的一部分。独立搜索引擎的检索机制、算法、范围等的不同,导致同样一个检索请求在不同搜索引擎中的查询重复率很低,小于34%[1]。Lawrence[2]等研究表明,所有的搜索引擎策略中索引的Web页面都不超过页面总数的三分之一。因此,获得全面、准确、更符合用户需求的检索结果,就必须反复多次的调用不同独立搜索引擎进行检索,但是在查准率和查全率方面的缺点是独立搜索引擎与生俱来无法改变的事实。为了解决传统独立搜索引擎存在的以上问题,元搜索引擎技术应运而生。元搜索的出现使这些问题在一定程度上有所解决,这使得元搜索引擎得到了学术界广泛关注和迅速的发展。元搜索引擎整合了多个独立搜索引擎的搜索结果,在查全率方面有很大程度提高,但同时却暴露出大量重复冗余信息、噪声、系统查准率不高的新问题,并且元搜索引擎依然没有考虑用户个性因素,一个搜索请求适用于全部用户,搜索过程没有考虑用户个性因素,信息检索结果无法满足每位用户的个性化需求,这直接影响了用户信息检索的质量和效果。尽量减少不相关信息的干扰,并且快捷方便地检索用户需求的信息,是本课题所研究的内容,也是个性化元搜索引擎的最终目标。本论文中,较详细地描述了目前搜索引擎的发展现状和研究热点;并针对独立搜索引擎的不足之处,详细介绍了个性化搜索引擎的结构框架;在对个性化元搜索引擎的特点和基于用户模型的研究方法进行了深入研究分析的基础之上,改进了成员搜索引擎调度算法,提出了成员搜索引擎结果贡献量及多维排序中分块的概念,提出基于用户兴趣及检索词串和搜索结果的文本相关度结果整合排序算法。论文的最后通过程序设计实现了个性化元搜索引擎系统,在该系统中对论文中所提出的算法进行了分析和实验,相比于一般元搜索引擎,查询显得更人性化,相比独立搜索引擎的查全率和查准率有着明显的提高,改善了用户的检索质量和检索体验。

全文目录


摘要  3-4
Abstract  4-8
引言  8-10
1 绪论  10-13
  1.1 研究背景与意义  10-11
  1.2 国内外研究现状  11
  1.3 论文的主要研究内容  11-12
  1.4 论文结构  12-13
2 搜索引擎与元搜索引擎概述  13-25
  2.1 搜索引擎简介  13-18
    2.1.1 搜索引擎概念  13
    2.1.2 搜索引擎的结构框架  13-15
    2.1.3 种类繁多的搜索引擎  15-16
    2.1.4 搜索引擎的发展  16-18
  2.2 元搜索引擎  18-22
    2.2.1 元搜索引擎概述  18-19
    2.2.2 元搜索体系结构  19-20
    2.2.3 元搜索引擎分类  20-21
    2.2.4 元搜索引擎的研究现状  21-22
  2.3 个性化搜索概述  22-24
    2.3.1 个性化搜索的现状  22-23
    2.3.2 个性化元搜索  23-24
  2.4 本章小结  24-25
3 成员搜索引擎选择算法研究  25-32
  3.1 成员搜索引擎选择概述  25-26
  3.2 现有成员搜索引擎选择算法  26-29
    3.2.1 定性方法  26-27
    3.2.2 定量方法  27-28
    3.2.3 基于学习的方法  28-29
  3.3 基于用户兴趣和结果贡献量的成员搜索引擎选择算法  29-31
    3.3.1 算法设计思路  30-31
    3.3.2 算法小结  31
  3.4 本章小结  31-32
4 元搜索引擎结果合成算法研究  32-40
  4.1 经典查询结果排序算法研究  32-36
  4.2 基于用户兴趣库/全局相关度排序算法  36-39
  4.3 本章小结  39-40
5 实验测试与性能分析  40-50
  5.1 实验测试  40-41
  5.2 实验评价标准  41-42
  5.3 实验结果与分析  42-49
  5.4 本章小结  49-50
6 总结  50-52
参考文献  52-57
在校研究成果  57-58
致谢  58

相似论文

  1. 基于BP网络的元搜索引擎研究,TP391.3
  2. 基于无线传输的公交车载媒体节目管理系统研究与开发,TP311.52
  3. 基于聚焦爬虫的网上药品信息监测系统,TP393.09
  4. Deep Web接口集成及查询结果排序方法研究,TP274
  5. WEB个性化信息采集与管理关键技术研究,TP393.09
  6. 中文文本分类特征提取方法的研究与实现,TP391.1
  7. 面向教育新闻的主题爬虫设计与实现,TP391.3
  8. SMBSDD:一种改进的非结构化P2P网络搜索机制,TP393.02
  9. 基于中文维基百科的语义相关度计算的研究与实现,TP391.1
  10. 基于Agent元搜索引擎的个性化研究,TP391.3
  11. 网络舆情信息采集系统的设计与实现,TP393.09
  12. 活性炭吸附VOCs与其孔结构构效关系研究,O647.31
  13. 基于CAN数字化校园一卡通系统消费终端研究,TP273
  14. Deep Web数据库的选择研究,TP311.13
  15. 基于用户兴趣模型的元搜索引擎的研究,TP391.3
  16. 汉英跨语言网址搜索引擎的设计与实现,TP391.3
  17. 基于元搜索的Web网络军事情报信息搜索技术研究,TP391.3
  18. 一个基于向量空间模型的个性化推荐系统,TP391.3
  19. 基于Web的中文元搜索引擎的研究及实现,TP391.3
  20. 个性化搜索中用户语义意图自动识别技术研究,TP391.1
  21. 基于本体的语义检索原型系统的设计与实现,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com