学位论文 > 优秀研究生学位论文题录展示
基于用户反馈的搜索引擎排名算法研究
作 者: 金祖旭
导 师: 李敏波
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 搜索引擎 用户反馈 神经网络 排序算法
分类号: TP391.3
类 型: 硕士论文
年 份: 2010年
下 载: 194次
引 用: 0次
阅 读: 论文下载
内容摘要
在过去的几年中,随着互联网的高速发展,搜索引擎的作用与日俱增,越来越多的互联网用户开始选择搜索引擎作为其获得网络资源的首选工具。但是,搜索引擎的表现并不总是尽如人意。很多时候,当用户输入一个查询词,搜索引擎会返回成千上万的搜索结果,而其中只有很少一部分甚至没有网页是符合用户需求的。如何理解用户的搜索意图,找出符合用户需求的网页,并将最相关的网页置于搜索结果的前列,这成为众多学者研究的重要课题。本文以Web 2.0中用户行为作为研究对象,通过挖掘用户反馈方式,提出用户反馈分值的概念,对用户反馈影响搜索结果排名的具体方法以及相应实现进行研究,并提出了一种基于神经网络的网页排序算法。该算法引入BP神经网络模型,根据用户反馈分值选择样本训练神经网络。将传统搜索结果输入到经过训练的神经网络进行计算,根据计算出的结果所表示的网页相关性强弱判断后进行二次排序。该算法利用了神经网络具有的模式识别能力,有效的将用户反馈和搜索引擎结合起来,使得搜索结果更加符合用户的搜索要求。本文设计开发了基于用户自定义关键词链接关系的搜索排名系统—“网标搜索”,并利用用户反馈对原系统基于Lucene搜索排名算法基础上的搜索结果进行二次排序。系统在排序过程中对有用户反馈的网页链接利用boost因子调整排名分值,对没有用户反馈的网页链接则使用神经网络的方法进行调整排序。文章结合用户反馈进行实验,对实验前后结果进行比较分析,为将来搜索领域中对用户反馈研究提供借鉴与参考的价值。
|
全文目录
摘要 4-5 Abstract 5-6 第一章 绪论 6-12 1.1 引言 6 1.2 相关知识 6-8 1.2.1 搜索引擎 6-7 1.2.2 人工神经网络 7-8 1.3 搜索排名国内外研究 8-10 1.4 论文研究内容和章节结构 10-12 第二章 传统排序算法分类及比较 12-21 2.1 基于网页内容的排序 12-16 2.1.1 VSM模型介绍 12-14 2.1.2 基于内容的排序 14-15 2.1.3 基于内容搜索的优缺点 15-16 2.2 基于链接结构的排序 16-20 2.2.1 PageRank算法分析 16-18 2.2.2 HITS算法分析 18-20 2.2.3 基于链接结构的优缺点 20 2.3 小结 20-21 第三章 用户反馈分析 21-26 3.1 反馈的概念 21-22 3.2 反馈的方式 22-24 3.2.1 显式反馈 22-23 3.2.2 隐式反馈 23-24 3.3 用户反馈分值定义 24-25 3.4 反馈对结果的影响 25-26 第四章 基于神经网络的网页排序算法 26-33 4.1 BP神经网络 26-27 4.2 内容信息转化为量化向量 27-30 4.2.1 中文分词算法 27-28 4.2.2 生成量化向量 28-30 4.3 神经网络训练算法 30-31 4.4 神经网络计算原理 31-32 4.5 对结果进行判断并排序 32-33 第五章 "网标搜索"系统 33-42 5.1 "网标搜索"介绍 33-34 5.2 系统数据设计 34-37 5.3 系统架构设计 37-40 5.3.1 开发架构 37 5.3.2 功能模块 37-40 5.4 Lucene排序算法介绍 40-42 第六章 算法应用分析 42-54 6.1 数据结构设计 42-43 6.2 基于Lucene的排名改进 43-45 6.3 基于神经网络的排名改进 45-53 6.3.1 神经网络构建 45 6.3.2 中文分词模块 45-46 6.3.3 数值化网页信息 46-47 6.3.4 神经网络训练 47-50 6.3.5 输出计算及结果比较 50-53 6.4 应用中涉及到的其它问题 53-54 第七章 总结与展望 54-56 7.1 总结 54 7.2 展望 54-56 参考文献 56-58 致谢 58-59
|
相似论文
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 红外超光谱图像的虚拟探测器研究,TP391.41
- 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
- 基于神经网络的水厂投药预测控制研究,TP273.1
- 视觉伺服四自由度机械臂的研究,TP242.6
- 机械臂视觉伺服系统的研究,TP242.6
- 压电驱动微工作台的控制与校正技术研究,TP273
- 某武器检测装置的控制系统设计,TP183
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 大学生综合素质测评研究,G645.5
- 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 基于神经网络辨识的同步发电机励磁控制研究,TM31
- 基于BP神经网络的水稻干燥智能控制研究,S226.6
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 海上平台消防系统研究,U698.4
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|