学位论文 > 优秀研究生学位论文题录展示
搜索引擎检索技术研究
作 者: 岳舜
导 师: 丁振国
学 校: 西安电子科技大学
专 业: 计算机系统结构
关键词: 搜索引擎 检索模型 查询器 缓存机制
分类号: TP391.3
类 型: 硕士论文
年 份: 2008年
下 载: 143次
引 用: 3次
阅 读: 论文下载
内容摘要
随着Internet迅猛发展,搜索引擎已经成为人们进行信息获取必不可少的工具。检索技术作为搜索引擎的核心技术之一,对信息准确、快速地获取起到了至关重要的作用。本文在传统向量空间模型的基础上,提出了一种改进的向量空间模型,该模型充分考虑了文档结构对词的重要性的影响,利用该模型进行相似度计算时,避免了向量空间模型查全率和查准率不高的缺点。在检索模型和缓存技术研究基础上,设计并实现了一个高效的检索系统,该检索系统包括查询器和缓存机制两个部分:查询器实现了简单查询和复杂查询两种查询方式;缓存机制制定了基于LRU和LFU的两种基本缓存策略,并采用哈希表缓存查找算法提高缓存查找效率。实验结果表明本文设计的检索系统的检索性能和缓存性能,都达到了实用的水平。
|
全文目录
摘要 3-4 Abstract 4-7 第一章 绪论 7-11 1.1 课题研究的目的和意义 7-8 1.2 国内外研究现状 8-9 1.3 论文的主要内容和贡献 9-10 1.4 论文结构 10-11 第二章 搜索引擎技术 11-27 2.1 搜索引擎的分类 11-13 2.1.1 目录式搜索引擎 11-12 2.1.2 机器人搜索引擎 12 2.1.3 元搜索引擎 12-13 2.2 搜索引擎的工作原理和体系结构 13-14 2.2.1 搜索引擎的工作原理 13 2.2.2 搜索引擎的体系结构 13-14 2.3 相关技术 14-24 2.3.1 网络爬虫技术 14-16 2.3.2 索引技术 16-18 2.3.3 排序技术 18-20 2.3.4 缓存技术 20-24 2.4 搜索引擎的发展趋势 24-27 第三章 信息检索模型 27-34 3.1 传统信息检索模型 27-28 3.2 向量空间模型的优缺点 28-29 3.3 改进的向量空间模型 29-32 3.4 性能测试及对比分析 32 3.5 本章小结 32-34 第四章 检索系统的设计与实现 34-51 4.1 功能分析及整体设计 34-35 4.2 检索系统查询器的设计与实现 35-41 4.2.1 查询器的结构及功能 35-36 4.2.2 接口程序 36-38 4.2.3 词典维护 38-39 4.2.4 查询实现 39-41 4.3 检索系统缓存机制的设计与实现 41-47 4.3.1 缓存机制的系统结构 41-43 4.3.2 缓存区管理器 43-45 4.3.3 缓存区 45-46 4.3.4 缓存性能测试与分析 46-47 4.4 系统性能测试与分析 47-50 4.4.1 衡量指标 47-48 4.4.2 查全率和查准率 48 4.4.3 响应时间 48-50 4.4.4 系统运行情况 50 4.5 本章小结 50-51 第五章 总结与展望 51-53 致谢 53-54 参考文献 54-57 读研期间研究成果 57-58
|
相似论文
- 网络搜索引擎的相关技术研究,G354
- 基于语义网络的智能搜索引擎研究,TP391.3
- 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
- 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
- 分布式搜索引擎索引安全及缓存策略研究,TP333
- 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
- 基于本体的智能电网知识检索系统,TM76
- 教育培训行业互联网营销问题的研究,F49
- 搜索引擎侵权行为研究,D923
- BlueOcean海量存储系统客户端的设计与实现,TP333
- 基于Web数据挖掘的个性化搜索引擎研究,TP391.3
- 基于Agent元搜索引擎的个性化研究,TP391.3
- 论搜索引擎竞价排名的法律规制,D923.43
- 搜索引擎悖论解读,G254
- 基于搜索引擎网页排序算法研究,TP391.3
- 网络下载侵权分析,D923.41
- 垂直门户网站产品搜索系统的设计与实现,TP393.092
- 基于领域知识的Deep Web接口发现研究,TP393.09
- 基于对等网络的搜索引擎关键技术研究,TP391.3
- 基于本体的智能答疑系统研究与实现,TP311.52
- 基于聚类分析的搜索引擎自动性能评价研究,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|