学位论文 > 优秀研究生学位论文题录展示

基于随机游走模型的个性化信息推荐

作 者: 王丽莎
导 师: 张绍武
学 校: 大连理工大学
专 业: 计算机应用技术
关键词: 个性化信息推荐 数据稀疏性 冷启动用户 信任网络 随机游走
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 205次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络信息和资源的急遽膨胀,用户面临着从海量数据中筛选自己所需信启、的困难,找到一种有效的工具或方法来帮助用户完成这个信息筛选的过程已成为一种必要。为了满足这种需求,个性化信息推荐服务应运而生,并且成功应用在各大社会媒体网站,如YouTube, MovieLens,亚马逊等。在推荐系统中最常用、实现过程较简单、性能也较好的一种技术就是协同过滤,然而数据稀疏性问题和冷启动问题成为了影响其推荐结果准确性的两大障碍因素。除此之外,协同过滤算法利用的数据只有用户对于项目的评分信息,但是随着网络的发展,我们可利用的资源还有用户的标签标注信息和社交网络信息,这些信息的合理应用都会在一定程度上提高推荐系统的性能。为了消减协同过滤算法中的数据稀疏性,本文首先在随机游走(RWR)算法的基础上进行了改进,提出了一种项目-标签导向的随机游走推荐模型(TRWR),针对特定用户分别在项目空间和标签空间中根据对象之间的相似性计算转移概率,进行有限步长的随机游走,在两个空间中都生成若干个待推荐项目,然后重新计算预测评分,最后对该用户进行个性化信息推荐。其次,在计算对象之间相似性的过程中,考虑到共同评分用户数也是影响对象之间相似度的一个重要因素,本文又对传统的Pearson Correlation公式进行了改进,采用了融合评分差异性和共同评分用户数的相似度计算方法。最后,除了用户对于项目的评分信息和标签标注信息,本文又引入了用户之间的信任网络信息,着重针对那些可利用数据较少的冷启动用户来进行个性化信息推荐。总的来说,本文在传统的协同过滤推荐算法的基础上引入了更多的用户信息,在项目空间、标签空间、用户信任网络中进行随机游走,目的是消减数据稀疏性和解决冷启动用户的推荐问题。本文分别在MovieLens数据集和Epinions数据集上对两种算法进行了验证,并且取得了不错的结果。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-13
  1.1 研究背景  8-9
  1.2 个性化信息推荐技术的研究现状  9-10
  1.3 待解决的问题  10-11
  1.4 本文工作  11-12
  1.5 本文的结构  12-13
2 相关知识及评测指标  13-20
  2.1 基于内容的推荐算法  13-15
  2.2 协同过滤推荐算法  15-18
    2.2.1 基于用户(User-Based)的协同过滤  16
    2.2.2 基于项目(Item-Based)的协同过滤  16-17
    2.2.3 基于模型(Model-Based)的协同过滤  17-18
  2.3 推荐性能的评测指标  18-20
    2.3.1 Precision值  18
    2.3.2 Recall值  18-19
    2.3.3 MAE值  19-20
3 基于项目和标签的随机游走个性化信息推荐模型  20-32
  3.1 方法  20-25
    3.1.1 Random Walk Recommender(RWR)算法  20-22
    3.1.2 项目-标签导向的随机游走模型(TRWR)  22-23
    3.1.3 相似度计算方法的改进  23-25
  3.2 实验结果及分析  25-31
    3.2.1 实验设计  25
    3.2.2 语料来源和数据剪枝  25
    3.2.3 对比实验的描述  25
    3.2.4 TRWR的实验结果对比与分析  25-27
    3.2.5 优化相似度计算方法后的实验结果对比与分析  27-29
    3.2.6 α值的变化对推荐结果的影响  29
    3.2.7 推荐项目数对TRWR性能的影响  29-31
  3.3 总结与下一步工作  31-32
4 基于信任网络的个性化信息推荐  32-43
  4.1 TrustWalker——信任网络和协同过滤融合的随机游走模型  32-35
    4.1.1 TrustWalker的一趟随机游走过程  33-35
    4.1.2 一趟随机游走的终止条件  35
    4.1.3 全局游走的终止条件  35
  4.2 对TrustWalker模型的改进  35-36
  4.3 实验结果及分析  36-42
    4.3.1 实验数据集  37-38
    4.3.2 实验结果  38-42
  4.4 下一步的工作  42-43
结论  43-45
参考文献  45-48
攻读硕士学位期间发表学术论文情况  48-49
致谢  49-50

相似论文

  1. 中美股市噪声交易比较研究,F832.51;F831.51
  2. 基于全局孤立性和局部紧凑性的显著目标检测算法研究,TP391.41
  3. 网络社区图像检索中的排序研究,TP391.41
  4. 基于用户聚类的协同过滤推荐系统研究,TP391.3
  5. 高精度光纤陀螺光源强度噪声抑制技术的研究,V241.5
  6. 基于网络论坛的舆论领袖发现技术研究,TP393.09
  7. 基于随机游走和聚类平滑的两阶段协同过滤算法,TP391.3
  8. 上海黄金市场的弱式有效性检验,F224
  9. 中国商品期货市场弱有效性研究,F224
  10. 我国A股市场有效性的实证研究,F224
  11. 上海股票市场有效性研究,F224
  12. C2C第三方零售电子商务平台企业信任机制剖析,F224
  13. 复杂网络社团模型与结构研究,C912.6
  14. 图上的关键字搜索算法,TP391.3
  15. 我国东北三省经济周期波动的经验分析,F127
  16. 基于语义Web的金融信息服务模式探讨,H313
  17. 基于社会网络的企业间信任关系研究,F270
  18. 不确定信息推理,TP18
  19. 移动代理电子商务环境下基于声誉的多维度信任算法研究,TP393.08
  20. 基于随机游走实现的快速NLM图像、视频去噪,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com