学位论文 > 优秀研究生学位论文题录展示

搜索引擎检索技术研究

作 者: 岳舜
导 师: 丁振国
学 校: 西安电子科技大学
专 业: 计算机系统结构
关键词: 搜索引擎 检索模型 查询器 缓存机制
分类号: TP391.3
类 型: 硕士论文
年 份: 2008年
下 载: 143次
引 用: 3次
阅 读: 论文下载
 

内容摘要


随着Internet迅猛发展,搜索引擎已经成为人们进行信息获取必不可少的工具。检索技术作为搜索引擎的核心技术之一,对信息准确、快速地获取起到了至关重要的作用。本文在传统向量空间模型的基础上,提出了一种改进的向量空间模型,该模型充分考虑了文档结构对词的重要性的影响,利用该模型进行相似度计算时,避免了向量空间模型查全率和查准率不高的缺点。在检索模型和缓存技术研究基础上,设计并实现了一个高效的检索系统,该检索系统包括查询器和缓存机制两个部分:查询器实现了简单查询和复杂查询两种查询方式;缓存机制制定了基于LRU和LFU的两种基本缓存策略,并采用哈希表缓存查找算法提高缓存查找效率。实验结果表明本文设计的检索系统的检索性能和缓存性能,都达到了实用的水平。

全文目录


摘要  3-4
Abstract  4-7
第一章 绪论  7-11
  1.1 课题研究的目的和意义  7-8
  1.2 国内外研究现状  8-9
  1.3 论文的主要内容和贡献  9-10
  1.4 论文结构  10-11
第二章 搜索引擎技术  11-27
  2.1 搜索引擎的分类  11-13
    2.1.1 目录式搜索引擎  11-12
    2.1.2 机器人搜索引擎  12
    2.1.3 元搜索引擎  12-13
  2.2 搜索引擎的工作原理和体系结构  13-14
    2.2.1 搜索引擎的工作原理  13
    2.2.2 搜索引擎的体系结构  13-14
  2.3 相关技术  14-24
    2.3.1 网络爬虫技术  14-16
    2.3.2 索引技术  16-18
    2.3.3 排序技术  18-20
    2.3.4 缓存技术  20-24
  2.4 搜索引擎的发展趋势  24-27
第三章 信息检索模型  27-34
  3.1 传统信息检索模型  27-28
  3.2 向量空间模型的优缺点  28-29
  3.3 改进的向量空间模型  29-32
  3.4 性能测试及对比分析  32
  3.5 本章小结  32-34
第四章 检索系统的设计与实现  34-51
  4.1 功能分析及整体设计  34-35
  4.2 检索系统查询器的设计与实现  35-41
    4.2.1 查询器的结构及功能  35-36
    4.2.2 接口程序  36-38
    4.2.3 词典维护  38-39
    4.2.4 查询实现  39-41
  4.3 检索系统缓存机制的设计与实现  41-47
    4.3.1 缓存机制的系统结构  41-43
    4.3.2 缓存区管理器  43-45
    4.3.3 缓存区  45-46
    4.3.4 缓存性能测试与分析  46-47
  4.4 系统性能测试与分析  47-50
    4.4.1 衡量指标  47-48
    4.4.2 查全率和查准率  48
    4.4.3 响应时间  48-50
    4.4.4 系统运行情况  50
  4.5 本章小结  50-51
第五章 总结与展望  51-53
致谢  53-54
参考文献  54-57
读研期间研究成果  57-58

相似论文

  1. 网络搜索引擎的相关技术研究,G354
  2. 基于语义网络的智能搜索引擎研究,TP391.3
  3. 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
  4. 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
  5. 分布式搜索引擎索引安全及缓存策略研究,TP333
  6. 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
  7. 基于本体的智能电网知识检索系统,TM76
  8. 教育培训行业互联网营销问题的研究,F49
  9. 搜索引擎侵权行为研究,D923
  10. BlueOcean海量存储系统客户端的设计与实现,TP333
  11. 基于Web数据挖掘的个性化搜索引擎研究,TP391.3
  12. 基于Agent元搜索引擎的个性化研究,TP391.3
  13. 论搜索引擎竞价排名的法律规制,D923.43
  14. 搜索引擎悖论解读,G254
  15. 基于搜索引擎网页排序算法研究,TP391.3
  16. 网络下载侵权分析,D923.41
  17. 垂直门户网站产品搜索系统的设计与实现,TP393.092
  18. 基于领域知识的Deep Web接口发现研究,TP393.09
  19. 基于对等网络的搜索引擎关键技术研究,TP391.3
  20. 基于本体的智能答疑系统研究与实现,TP311.52
  21. 基于聚类分析的搜索引擎自动性能评价研究,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com