学位论文 > 优秀研究生学位论文题录展示

基于信息型模型的音乐推荐算法

作 者: 程兵
导 师: 俞勇
学 校: 上海交通大学
专 业: 计算机应用技术
关键词: 信息型模型 协同过滤 矩阵分解 反例抽取
分类号: TP391.3
类 型: 硕士论文
年 份: 2012年
下 载: 61次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网上面内容提供商提供的信息以爆炸式的速度急剧增长,推荐系统的作用也变得越来越重要。在过去的几年中,推荐系统在帮助用户更有效的获取有价值的信息方面已经显现出了巨大的潜力。在实际的应用环境中,推荐系统往往对内容提供商和用户都会带来极大的便利,以亚马逊网站1为例,向用户推荐其可能会感兴趣的产品不光可以增加网站的销售额,还可以提高用户体验。在今年的KDD Cup Challenge2比赛中,Yahoo Labs开放了一个规模很大的用户对音乐数据打分的数据集。整个比赛分成两个子比赛,第一个比赛是一个打分预测问题,类似于Net?ix Prize Challenge3,目标在于缩小预测打分值同实际打分值之间的差距;第二个比赛的目标是,对于一个给定的用户,我们需要把该用户打过高分的三首歌和该用户从未打过分的三首歌区分开,这里打高分是指打分值大于等于80。在这篇论文中,我们主要解决第二个比赛中所提到的问题。我们把这个问题当成Top-n推荐的一种特殊形式来对待,也就是说,用模型预测出来的分数较高的三首歌作为用户打过高分的歌曲,其余三首看做用户从未打过分的歌曲。在这篇论文中,我们采用基于排序的SVD(Singular Value Decomposition)模型来解决这个问题,同时,我们还采用反例抽取技术来补充训练数据中反例的数量。最重要的是,我们提出了一种基于特征的信息型模型来解决这个问题,数据集中各种不同的信息都可以作为特征集成到该模型中来,形成一个综合的单模型。在推荐系统中,为了提高最终模型的准确率,通常都会采用混合模型的方法。由于不同模型能够刻画数据中不同的信息,因此混合模型往往能够取得超过单模型的效果。在本文所讨论的这个问题上面,所有已经发表的结果也都是采用这种方法。然而,混合模型往往需要更多的计算代价,毫无疑问,能够取得接近混合模型效果的单模型更加实用。在本文中,我们主要讨论这种模型。在该模型中,不同种类的信息,比如条目层次结构(详见2.1小节)、条目近邻关系、用户相关特征以及隐式反馈等,都被集成到一个单模型中。通过这个模型,我们在测试数据集上的错误率只有3.1%,这是所有在这个问题上已经发表的结果中最好的单模型结果,甚至已经超过了很多混合模型的准确度。

全文目录


摘要  3-5
ABSTRACT  5-7
目录  7-9
第一章 引言  9-12
  1.1 动机  9-10
  1.2 主要贡献  10-11
  1.3 本文的组织结构  11
  1.4 本章小结  11-12
第二章 准备知识  12-14
  2.1 数据集的主要特点  12
  2.2 问题陈述  12-13
  2.3 符号、记号定义  13-14
第三章 相关工作  14-22
  3.1 基于近邻的方法  14-16
  3.2 基于矩阵分解的方法  16-19
    3.2.1 PureSVD  17-18
    3.2.2 SVD  18-19
  3.3 时间动态  19-21
  3.4 本章小结  21-22
第四章 基于排序的协同过滤算法以及反例抽取  22-31
  4.1 基于优化RMSE 的SVD 模型  22-23
  4.2 基于排序的协同过滤模型  23-28
    4.2.1 EigenRank  23-25
    4.2.2 pLPA  25-26
    4.2.3 基于排序的SVD 模型  26-28
  4.3 反例抽取  28-30
  4.4 本章小结  30-31
第五章 信息型模型与基于排序的SVD 模型的融合  31-39
  5.1 信息型模型  31-33
  5.2 基于条目层次结构的SVD 模型  33-35
  5.3 集成隐式反馈信息  35
  5.4 集成基于条目的近邻信息  35-37
  5.5 集成基于条目层次结构的分类器  37-38
  5.6 本章小结  38-39
第六章 实验结果及其分析  39-48
  6.1 数据集介绍  39-40
  6.2 评价标准  40-41
  6.3 信息型模型的作用  41-44
    6.3.1 最佳模型  43-44
  6.4 反例抽取的影响  44-45
  6.5 参数调节  45-47
  6.6 本章小节  47-48
第七章 全文总结与展望  48-49
参考文献  49-53
致谢  53-54
攻读学位期间发表的学术论文目录  54-56

相似论文

  1. 基于自然遗忘的个性化推荐算法研究,TP311.52
  2. 联合聚类算法研究及应用,TP311.13
  3. 基于蚁群算法的移动商务个性化推荐体系研究,TP391.3
  4. 调强放疗强度矩阵分解研究,R730.5
  5. 基于协同过滤的用户兴趣发现,TP391.3
  6. 面向图像表达的非负局部坐标分解算法,TP391.41
  7. 基于矩阵分解的MIMO-OFDM半盲信道估计算法设计与实现,TN919.3
  8. 基于稀疏非负矩阵分解的图像检索,TP391.41
  9. 基于社会化标签体系的个性化推荐引擎技术研究,TP391.3
  10. 基于GPU的图书推荐系统研究与实现,TP391.3
  11. 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
  12. 跨系统个性化服务中隐私保持问题研究,TP393.08
  13. 基于协同过滤的电子商务个性化推荐算法研究,F713.36
  14. 基于自然语言处理与非负矩阵分解的中文文本分类研究,TP391.1
  15. 云计算及若干数据挖掘算法的MapReduce化研究,TP311.13
  16. 基于流形对齐的论坛个性化推荐与检索,TP391.3
  17. 基于拓扑势的社区协同过滤方法的设计与实现,TP393.093
  18. 基于相关度和关联属性偏好的个性化推荐算法研究,TP391.3
  19. 电子商务协同过滤算法的研究与实现,TP301.6
  20. 基于协同过滤的教学资源个性化推荐技术的研究及应用,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com