学位论文 > 优秀研究生学位论文题录展示

基于查询分类的增量式用户个性化建模技术研究

作 者: 张宁
导 师: 陈纯;王灿
学 校: 浙江大学
专 业: 计算机软件与理论
关键词: 个性化搜索 用户兴趣模型 查询分类
分类号: TP393.092
类 型: 硕士论文
年 份: 2008年
下 载: 143次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着Web上信息量的增长,搜索引擎成了人们检索信息的重要工具,Google、Baidu等主流的搜索引擎成了网民工作学习中不可或缺的重要工具。但是这些通用搜索引擎不能更加准确地了解用户的需求,不能针对特定的用户给予个性化的服务,因此如何提供一种切实有效的方法,以用户为中心,帮助用户有针对性地获取真正需要的信息,成了研究者们所面临的一个重要课题,因而个性化搜索技术逐渐兴起。用户兴趣模型是个性化搜索的关键技术之一,是一个能为用户提供个性化信息服务的信息检索系统的核心组成部分。本文对当前主要的用户兴趣模型进行了研究,提出了一种基于挖掘用户查询日志建立的增量式更新的用户兴趣模型。本文的工作主要包括以下三个方面:(1)基于伪相关反馈技术,利用搜索引擎的搜索结果对查询日志进行查询扩展,结合文本特征提取、文本分类等技术建立查询分类模型。(2)在查询分类的基础上,提出一种基于向量表示的用户兴趣模型,表示用户对各个分类领域的兴趣程度。(3)对比平均加权算法、时间窗算法,引入遗忘因子,提出一种符合人的遗忘规律的增量式的用户兴趣模型更新算法。本文还通过实验系统的设计和实验数据的分析,对其中关键的查询分类准确率和用户兴趣模型的稳定性和及时性进行评估,并在本文的最后提出进一步的研究方向。

全文目录


摘要  3-4
Abstract  4-9
第1章 绪论  9-12
  1.1 研究背景  9-10
  1.2 研究的目的和意义  10
  1.3 本文结构  10-12
第2章 相关技术研究  12-28
  2.1 用户兴趣建模技术综述  12-21
    2.1.1 用户兴趣信息获取  14-16
    2.1.2 用户兴趣模型的表示方法  16-18
    2.1.3 用户兴趣建模技术  18-19
    2.1.4 用户模型更新方式  19-21
  2.2 向量空间模型及文本特征提取技术  21-23
  2.3 文本分类技术  23-26
    2.3.1 简单向量距离分类法  24
    2.3.2 k-Nearest Neighbors  24-25
    2.3.3 Na(?)ve Bayes  25
    2.3.4 支持向量机(SVM)  25-26
  2.4 本章小结  26-28
第3章 基于伪相关反馈的查询分类方法  28-34
  3.1 查询分类相关研究  28-30
    3.1.1 基于图的迭代查询聚类  28-29
    3.1.2 基于伪相关反馈的查询分类  29-30
  3.2 基于伪相关反馈的查询分类算法  30-33
  3.3 本章小结  33-34
第4章 基于查询分类的增量式用户建模  34-41
  4.1 基于查询分类的用户兴趣模型  34
  4.2 用户兴趣模型的建立和初始化  34-36
  4.3 用户兴趣模型更新算法  36-40
    4.3.1 用户兴趣模型更新机制  36-37
    4.3.2 增量式模型更新算法  37-40
  4.4 用户兴趣模型的性能评价标准  40
  4.5 本章小结  40-41
第5章 实验与数据分析  41-52
  5.1 实验系统设计  41-43
  5.2 实验数据处理  43-45
    5.2.1 数据的预处理  43
    5.2.2 训练文本集合  43-45
  5.3 实验数据分析  45-51
    5.3.1 基于伪相关反馈的查询分类性能分析  45-48
    5.3.2 自适应增量更新算法的实验结果分析  48-51
  5.4 本章小结  51-52
第6章 总结与展望  52-54
  6.1 本文工作总结  52
  6.2 进一步的工作  52-54
参考文献  54-57
致谢  57-58
作者简历  58

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
  3. 基于Agent元搜索引擎的个性化研究,TP391.3
  4. 基于移动搜索用户关联的信息检索研究,TP391.3
  5. RSS个性化信息服务的用户兴趣模型研究及应用,TP393.09
  6. 中文搜索引擎的个性化服务研究,TP391.3
  7. Web查询分类方法的改进,TP393.09
  8. 个性化信息服务系统中用户建模技术研究,TP391.3
  9. 用户兴趣模型在RSS网络信息服务中的研究,TP393.09
  10. 基于Ontology的个性化信息服务方法研究,TP18
  11. 基于领域知识和信息抽取的个性化Web查询系统,TP393.09
  12. 搜索引擎个性化检索技术的研究,TP391.3
  13. 面向语义Web服务的发现机制研究,TP393.09
  14. 基于大规模搜索日志挖掘的上下文感知搜索研究,TP391.3
  15. 联合数字图书馆信息服务的关键技术研究,G250.76
  16. 个性化文献检索技术研究,TP391.3
  17. 融合本体和用户兴趣的专利信息检索系统的研究与实现,TP391.3
  18. 面向个性化服务的用户兴趣建模及应用研究,TP311.52
  19. 基于多Agent的个性化信息检索技术的研究,TP391.3
  20. 基于用户兴趣模型的服务发现方法研究,TP393.09

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com