学位论文 > 优秀研究生学位论文题录展示

个性化检索中相似用户群的获取与更新

作 者: 郑伟
导 师: 张宇
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 个性化检索 协作过滤 相似用户群 相关性模型
分类号: TP391.3
类 型: 硕士论文
年 份: 2008年
下 载: 75次
引 用: 1次
阅 读: 论文下载
 

内容摘要


下一代搜索引擎的一个突出特点是个性化,个性化信息检索是以用户为中心的信息检索技术,它获取以多种形式表达的用户需求(包括显式的、隐式的以及相关用户的需求),并综合利用这些用户信息,提高信息检索系统的性能。作为个性化检索中的重要研究子课题,相似用户群的建立与更新的任务是,通过对用户检索和浏览历史的分析,建立兴趣相似的用户群,并随着用户信息和检索领域的变化对相似用户群进行更新。相似用户群的建立与更新任务面临的主要问题是,缺乏合理的任务划分和标准评测集,无法对相似用户群系统进行公正的评价。因此,本文通过对个性化检索进行合理的任务划分,将相似用户群划分为一个独立的子任务,并利用开发的语料标注辅助系统,为其建立了标准评测集,使得可以对相似用户群的系统进行公正的评价和比较。在相似用户群的研究中,由于用户间共同评价过的网页较少,数据稀疏成为限制相似用户群建立效果的重要问题,因此,本文对相似用户群建立的研究主要集中在解决数据稀疏问题上。本文提出了基于相关性模型的相似用户群建立方法,采用相关性模型,利用相似领域中的相似用户,对当前领域中的用户查看数据进行扩充,以解决数据稀疏问题。同时,根据实际情况,随着领域的不同对相似用户群不断进行更新,以使相似用户群的建立更加准确。实验语料为标注者针对天网100G语料进行的检索行为和标注的答案,评测指标采用错检率、漏检率和系统性能损耗代价。此方法的性能在测试语料集上比baseline方法提高了7.12%,说明基于相关性模型的相似用户群方法可以很好地解决数据稀疏,同时由于利用用户群兴趣挖掘单个用户兴趣,防止了用户兴趣判断的偏差,提高相似用户群建立的效果。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-16
  1.1 课题背景  8-9
  1.2 课题的研究目的和意义  9-11
    1.2.1 课题的研究目的  9
    1.2.2 课题的研究意义  9-10
    1.2.3 相似用户群研究的应用  10-11
  1.3 国内外相关研究  11-15
    1.3.1 相似用户的判断  11-14
    1.3.2 解决数据稀疏问题的研究  14-15
  1.4 本章小结  15-16
第2章 个性化检索任务划分及评测  16-28
  2.1 个性化检索的任务划分  16-21
    2.1.1 用户新兴趣发现  16-18
    2.1.2 用户兴趣跟踪  18-19
    2.1.3 相似用户群建立  19-21
    2.1.4 个性化检索  21
  2.2 语料标注的辅助系统  21-25
    2.2.1 系统介绍  21-24
    2.2.2 正确答案记录  24-25
    2.2.3 语料规模  25
  2.3 相似用户群的评测  25-26
    2.3.1 评测机制  25-26
    2.3.2 评测方法  26
  2.4 本章小结  26-28
第3章 用户兴趣发现与跟踪  28-34
  3.1 用户新兴趣发现  28-32
    3.1.1 基于向量空间模型的新兴趣发现方法  28-29
    3.1.2 基于TextTiling 的新兴趣发现方法  29-31
    3.1.3 实验结果及分析  31-32
  3.2 用户兴趣跟踪  32-33
    3.2.1 实验方法  32
    3.2.2 实验结果及分析  32-33
  3.3 本章小结  33-34
第4章 基于相关性模型的数据扩充方法研究  34-42
  4.1 话题跟踪研究简介  34-35
  4.2 相关性模型  35
  4.3 基于向量空间模型的相关性模型  35-36
  4.4 基于话题核心与新颖部分的话题跟踪  36-38
    4.4.1 话题核心的构建  37
    4.4.2 利用改进相关性模型调整话题的新颖部分  37-38
    4.4.3 话题模型的构建  38
  4.5 实验及结果分析  38-41
    4.5.1 实验语料及评测机制  39
    4.5.2 实验结果  39-41
  4.6 本章小结  41-42
第5章 基于相关性模型的相似用户群研究  42-50
  5.1 相关研究  42-45
  5.2 基于相关性模型的相似用户群建立  45-46
    5.2.1 用户数据扩充  45-46
    5.2.2 用户相似度计算  46
  5.3 实验及结果分析  46-49
    5.3.1 实验语料  47
    5.3.2 实验结果分析  47-49
  5.4 本章小结  49-50
结论  50-51
参考文献  51-55
攻读学位期间发表的学术论文  55-57
致谢  57

相似论文

  1. 基于压缩感知的分布式视频编码技术研究,TN919.81
  2. 基于社会标签系统的推荐技术研究,TP391.3
  3. 基于Slope One算法的协作过滤个性化推荐系统设计与实现,TP391.3
  4. 基于基础教育领域本体的智能搜索代理模型研究,TP391.3
  5. 个性化服务网站研究,TP393.092
  6. 会计制度变迁与上市公司盈余稳健性,F276.6
  7. 基于基因表达式编程的Web个性化推荐技术研究,TP393.09
  8. 基于流形对齐的论坛个性化推荐与检索,TP391.3
  9. 基于Sogou日志的个性化信息检索分析与建模,TP391.3
  10. 基于协作过滤的反垃圾邮件网关的设计与实现,TP393.098
  11. 基于内容的图像检索中相关反馈技术的研究及系统实现,TP391.3
  12. 基于内容的个性化Web信息检索系统的设计与实现,TP391.3
  13. WEB上基于文本挖掘的个性化检索系统的设计与实现,TP393.09
  14. 基于用户兴趣的个性化WEB检索,TP393.09
  15. 活动星系核的光变研究,P152
  16. 股票市场及其价格波动与我国货币政策相关性研究,F224
  17. 基于混合模式的文本过滤系统的研究,TP391.1
  18. 基于概率模型的名人网页相关度评价研究,TP391.1
  19. 面向IETM的个性化检索系统研究,TP391.3
  20. 基于人工免疫系统的推荐系统研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com