学位论文 > 优秀研究生学位论文题录展示
个性化检索中相似用户群的获取与更新
作 者: 郑伟
导 师: 张宇
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 个性化检索 协作过滤 相似用户群 相关性模型
分类号: TP391.3
类 型: 硕士论文
年 份: 2008年
下 载: 75次
引 用: 1次
阅 读: 论文下载
内容摘要
下一代搜索引擎的一个突出特点是个性化,个性化信息检索是以用户为中心的信息检索技术,它获取以多种形式表达的用户需求(包括显式的、隐式的以及相关用户的需求),并综合利用这些用户信息,提高信息检索系统的性能。作为个性化检索中的重要研究子课题,相似用户群的建立与更新的任务是,通过对用户检索和浏览历史的分析,建立兴趣相似的用户群,并随着用户信息和检索领域的变化对相似用户群进行更新。相似用户群的建立与更新任务面临的主要问题是,缺乏合理的任务划分和标准评测集,无法对相似用户群系统进行公正的评价。因此,本文通过对个性化检索进行合理的任务划分,将相似用户群划分为一个独立的子任务,并利用开发的语料标注辅助系统,为其建立了标准评测集,使得可以对相似用户群的系统进行公正的评价和比较。在相似用户群的研究中,由于用户间共同评价过的网页较少,数据稀疏成为限制相似用户群建立效果的重要问题,因此,本文对相似用户群建立的研究主要集中在解决数据稀疏问题上。本文提出了基于相关性模型的相似用户群建立方法,采用相关性模型,利用相似领域中的相似用户,对当前领域中的用户查看数据进行扩充,以解决数据稀疏问题。同时,根据实际情况,随着领域的不同对相似用户群不断进行更新,以使相似用户群的建立更加准确。实验语料为标注者针对天网100G语料进行的检索行为和标注的答案,评测指标采用错检率、漏检率和系统性能损耗代价。此方法的性能在测试语料集上比baseline方法提高了7.12%,说明基于相关性模型的相似用户群方法可以很好地解决数据稀疏,同时由于利用用户群兴趣挖掘单个用户兴趣,防止了用户兴趣判断的偏差,提高相似用户群建立的效果。
|
全文目录
摘要 4-5 Abstract 5-8 第1章 绪论 8-16 1.1 课题背景 8-9 1.2 课题的研究目的和意义 9-11 1.2.1 课题的研究目的 9 1.2.2 课题的研究意义 9-10 1.2.3 相似用户群研究的应用 10-11 1.3 国内外相关研究 11-15 1.3.1 相似用户的判断 11-14 1.3.2 解决数据稀疏问题的研究 14-15 1.4 本章小结 15-16 第2章 个性化检索任务划分及评测 16-28 2.1 个性化检索的任务划分 16-21 2.1.1 用户新兴趣发现 16-18 2.1.2 用户兴趣跟踪 18-19 2.1.3 相似用户群建立 19-21 2.1.4 个性化检索 21 2.2 语料标注的辅助系统 21-25 2.2.1 系统介绍 21-24 2.2.2 正确答案记录 24-25 2.2.3 语料规模 25 2.3 相似用户群的评测 25-26 2.3.1 评测机制 25-26 2.3.2 评测方法 26 2.4 本章小结 26-28 第3章 用户兴趣发现与跟踪 28-34 3.1 用户新兴趣发现 28-32 3.1.1 基于向量空间模型的新兴趣发现方法 28-29 3.1.2 基于TextTiling 的新兴趣发现方法 29-31 3.1.3 实验结果及分析 31-32 3.2 用户兴趣跟踪 32-33 3.2.1 实验方法 32 3.2.2 实验结果及分析 32-33 3.3 本章小结 33-34 第4章 基于相关性模型的数据扩充方法研究 34-42 4.1 话题跟踪研究简介 34-35 4.2 相关性模型 35 4.3 基于向量空间模型的相关性模型 35-36 4.4 基于话题核心与新颖部分的话题跟踪 36-38 4.4.1 话题核心的构建 37 4.4.2 利用改进相关性模型调整话题的新颖部分 37-38 4.4.3 话题模型的构建 38 4.5 实验及结果分析 38-41 4.5.1 实验语料及评测机制 39 4.5.2 实验结果 39-41 4.6 本章小结 41-42 第5章 基于相关性模型的相似用户群研究 42-50 5.1 相关研究 42-45 5.2 基于相关性模型的相似用户群建立 45-46 5.2.1 用户数据扩充 45-46 5.2.2 用户相似度计算 46 5.3 实验及结果分析 46-49 5.3.1 实验语料 47 5.3.2 实验结果分析 47-49 5.4 本章小结 49-50 结论 50-51 参考文献 51-55 攻读学位期间发表的学术论文 55-57 致谢 57
|
相似论文
- 基于压缩感知的分布式视频编码技术研究,TN919.81
- 基于社会标签系统的推荐技术研究,TP391.3
- 基于Slope One算法的协作过滤个性化推荐系统设计与实现,TP391.3
- 基于基础教育领域本体的智能搜索代理模型研究,TP391.3
- 个性化服务网站研究,TP393.092
- 会计制度变迁与上市公司盈余稳健性,F276.6
- 基于基因表达式编程的Web个性化推荐技术研究,TP393.09
- 基于流形对齐的论坛个性化推荐与检索,TP391.3
- 基于Sogou日志的个性化信息检索分析与建模,TP391.3
- 基于协作过滤的反垃圾邮件网关的设计与实现,TP393.098
- 基于内容的图像检索中相关反馈技术的研究及系统实现,TP391.3
- 基于内容的个性化Web信息检索系统的设计与实现,TP391.3
- WEB上基于文本挖掘的个性化检索系统的设计与实现,TP393.09
- 基于用户兴趣的个性化WEB检索,TP393.09
- 活动星系核的光变研究,P152
- 股票市场及其价格波动与我国货币政策相关性研究,F224
- 基于混合模式的文本过滤系统的研究,TP391.1
- 基于概率模型的名人网页相关度评价研究,TP391.1
- 面向IETM的个性化检索系统研究,TP391.3
- 基于人工免疫系统的推荐系统研究,TP18
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|