学位论文 > 优秀研究生学位论文题录展示

基于点击日志的搜索引擎用户满意度评价研究

作 者: 邓晓妹
导 师: 武刚
学 校: 北京林业大学
专 业: 管理科学与工程
关键词: 多元回归分析 BP神经网络 搜索引擎评价 用户点击日志
分类号: TP391.3
类 型: 硕士论文
年 份: 2013年
下 载: 61次
引 用: 0次
阅 读: 论文下载
 

内容摘要


搜索引擎评价问题是搜索引擎研究领域的重要课题之一。传统的搜索引擎评价方法通过手工构造查询样例集合和人工标注查询答案集合的方式来评价搜索引擎,需要巨大的人力和时间成本。随着搜索引擎处理的数据规模的日益庞大,这种方法已不能满足当前搜索引擎系统的评价要求。由于搜索引擎的用户点击日志隐含了用户对搜索引擎结果的判断,而且易于获取,因此,研究人员提出一种使用用户点击日志进行搜索引擎评价的思路,利用用户点击日志来评价搜索引擎成为搜索引擎研究领域的一个新方向。本文提出一种利用用户点击日志来评价搜索引擎的方法,从用户的角度出发,分析用户与搜索引擎之间的交互点击日志,从中提取出能够反映搜索引擎用户满意度的特征,利用这些特征作为评价指标来评价搜索引擎用户满意度,能够大大减少搜索引擎质量评价所需的人力代价和时间代价。通过搜索引擎日志数据,分析了搜索引擎用户点击行为,选择网页搜索结果排名、网页点击率、网页平均浏览时间作为用户满意度特征。结合具体的实验数据集,分别运用多元线性回归分析、多元对数回归分析和BP神经网络方法,建立了基于用户点击日志的搜索引擎用户满意度评价模型,实现对搜索引擎用户满意度的自动评价。最后通过实验对多元线性回归模型、多元对数回归模型和BP神经网络模型的结果进行了比较与分析。实验证明本文提出的基于用户点击日志的搜索引擎用户满意度评价模型实现了对搜索引擎结果的自动评价,有一定的实用价值。

全文目录


摘要  4-5
ABSTRACT  5-7
1 引言  7-10
  1.1 研究背景  7
  1.2 研究目的和意义  7
  1.3 研究内容  7-8
  1.4 技术路线图  8-10
2 搜索引擎评价研究概述  10-17
  2.1 搜索引擎概述  10-12
  2.2 搜索引擎评价方法  12-15
  2.3 利用用户点击日志评价搜索弓I擎  15-17
3 基于用户点击日志的搜索引擎评价研究  17-22
  3.1 搜索引擎用户行为分析  17-18
  3.2 搜索引擎用户点击日志分析  18-20
  3.3 搜索引擎用户满意度评价指标  20-22
4 搜索引擎用户满意度评价模型  22-38
  4.1 实验数据集构建  22-26
    4.1.1 样本数据的选择  22
    4.1.2 样本数据的人工标注  22-23
    4.1.3 实验数据分析  23-26
  4.2 基于回归分析的搜索引擎用户满意度评价模型  26-29
    4.2.1 问题描述  26
    4.2.2 线性回归模型  26-27
    4.2.3 对数回归模型  27-28
    4.2.4 模型性能比较  28-29
  4.3 基于BP神经网络的搜索引擎用户满意度评价模型  29-36
    4.3.1 BP神经网络的原理  29-31
    4.3.2 建立BP神经网络模型  31-33
    4.3.3 MATLAB中的BP神经网络工具箱函数  33-35
    4.3.4 MATLAB求解BP神经网络模型  35-36
  4.4 结果评估与分析  36-38
5 结论  38-40
参考文献  40-43
个人简介  43-44
导师简介  44-45
获得成果目录清单  45-46
致谢  46

相似论文

  1. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  2. 机械臂视觉伺服系统的研究,TP242.6
  3. 市级旅游用地规划环境影响评价研究,X820.3
  4. 珠三角地区高性能混凝土配合比智能化系统,TU528
  5. 大学生综合素质测评研究,G645.5
  6. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  7. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  8. 高速公路拆迁民众生存系统评价研究,D523
  9. 煤矿风险信息集成与智能预警研究,X936
  10. 基于多杀毒软件协同的病毒检测方法研究,TP309.5
  11. 基于遗传算法的前馈神经网络优化研究,TP183
  12. JSYJ公司采购风险管理研究,F426.92
  13. 神经网络与组合预测在高速公路路面管理系统的应用研究,TP315
  14. 基于FLAC3D和神经网络的基坑变形预测系统研究,TU433
  15. 基于计算机视觉的柑橘品质分级技术研究,TP391.41
  16. 基于数据融合技术舞台故障诊断方法的研究,TP18
  17. 基于灰色神经网络的旅游上市公司财务危机预警模型研究,F224
  18. 遗传神经网络在地表水水质评价中的应用研究,X824
  19. 基于神经网络与GPU的手写数字识别及其试卷管理,TP391.43
  20. 基于改进BP算法的安全库存量预测模型的研究,O227
  21. 基于神经网络的漯河技术监督局食品安全预警系统研究,F203

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com