学位论文 > 优秀研究生学位论文题录展示
社会化网络中的推荐算法及其应用
作 者: 汪永强
导 师: 俞勇
学 校: 上海交通大学
专 业: 计算机应用技术
关键词: 推荐系统 评分预测 用户相似度 机器学习 时间效应
分类号: TP391.3
类 型: 硕士论文
年 份: 2012年
下 载: 207次
引 用: 0次
阅 读: 论文下载
内容摘要
随着web2.0的不断发展,社会化网络中的用户不断创造大量的信息。过量的数据使得用户无法有效地获取自己想要的信息,信息的使用率反而降低,信息过载的问题日益加剧。目前的搜索引擎等技术只能满足人们部分的需求,没有个性化的考虑,仍无法有效地解决这个问题。推荐系统作为一种信息过滤手段,是解决这个问题非常有潜力的方法。因而如何发展高效的,可扩展的,非常精确的推荐算法是一个巨大的挑战。评分预测是推荐系统的一个重要任务,基于对一个完善的推荐系统的追求,本文从从三个方向对评分预测问题中的推荐算法进行了分析和探索。首先,为了更好利用其他用户来做社会化的推荐,准确高效的衡量用户之间的相似度是一个关键,基于已有方法存在的问题和不足,我们提出了计数相似性和相似度传递两种方法。通过实验我们发现这两种方法能够有效的提升预测精度和应对可扩展性问题及数据稀疏性问题。其次,基于简单高效的slope one算法,我们为它引入了机器学习的思想,利用随机梯度下降方法调整权重和物品偏差,并对评分数据中包含的明显的用户倾向性和物品倾向性特征进行建模,使得它的预测精确度有了很大的提升。最后,我们还分析和探讨了推荐系统中三种时间效应:用户倾向性随时间变化,物品倾向性随时间变化以及用户兴趣随时间的变化,然后我们分别介绍了我们如何在slope one算法的物品偏差矩阵构建阶段与评分预测阶段应用时间维度的信息。通过在两个数据集上的实验,我们发现合理的使用时间维度的信息,不仅能提升推荐算法的预测精度,还能在一些情况下减少计算耗费。
|
全文目录
摘要 3-4 ABSTRACT 4-6 目录 6-9 表格索引 9-10 插图索引 10-11 第一章 绪论 11-17 1.1 引言 11-12 1.2 推荐系统 12-14 1.3 本课题研究内容 14-15 1.4 本文的组织结构 15-17 第二章 国内外研究现状 17-35 2.1 推荐系统发展历程 17-22 2.1.1 Tapestry: 最早的协同过滤系统之一 17-18 2.1.2 GroupLens 和 MovieLens: 新闻推荐系统和电影推荐系统 18-19 2.1.3 Netflix 大奖:推荐系统领域最著名的比赛活动 19-20 2.1.4 电子商务领域推荐系统的兴起 20-22 2.2 相关推荐算法 22-35 2.2.1 基于内容的推荐 22-25 2.2.2 基于协同过滤的推荐 25-32 2.2.3 基于用户-产品二部图网络结构的推荐 32 2.2.4 混合推荐 32-33 2.2.5 其他 33-35 第三章 优化相似度衡量方法 35-49 3.1 基于用户近邻的推荐算法框架 36-37 3.2 常用相似度算法 37-39 3.2.1 夹角余弦相似性 37-38 3.2.2 修正的夹角余弦相似性 38 3.2.3 皮尔逊相关系数 38-39 3.3 问题与不足 39-40 3.3.1 数据稀疏性问题 39 3.3.2 可扩展性问题 39 3.3.3 冷启动问题 39-40 3.4 计数相似性算法(Counting Similarity) 40-41 3.5 用户相似度的传递(Similarity Transfer) 41-43 3.6 实验与分析 43-47 3.6.1 数据集 43-44 3.6.2 评估标准与实验设置 44 3.6.3 计数相似性的效果 44-45 3.6.4 在不同稀疏性数据集上的结果 45-47 3.7 本章小结 47-49 第四章 基于Slope One 的算法优化和改进 49-69 4.1 Slope One 算法 50-52 4.2 加权Slope One 算法 52 4.3 基于机器学习的Slope One 算法 52-59 4.3.1 基于学习的Slope One 算法(The Learned Slope One Ap-proach) 52-53 4.3.2 基于学习的偏置 Slope One 算法(The Biased Learned Slope One Approach) 53-55 4.3.3 偏差矩阵的学习 55-56 4.3.4 实验与分析 56-59 4.4 基于时间的Slope One 算法 59-67 4.4.1 推荐系统中的时间效应 60-61 4.4.2 偏差矩阵构建阶段 61-62 4.4.3 评分预测阶段 62-63 4.4.4 系统更新阶段 63 4.4.5 实验与分析 63-67 4.5 本章小结 67-69 第五章 总结与展望 69-71 参考文献 71-77 致谢 77-79 攻读学位期间发表的学术论文目录 79-81
|
相似论文
- 基于数据分布特征的文本分类研究,TP391.1
- 基于自然遗忘的个性化推荐算法研究,TP311.52
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- Android恶意软件静态检测方案的研究,TP309
- 监督主题模型的研究与应用,TP391.1
- 基于失真效应的图像质量评价与分类,TP391.41
- 基于学习的逆向运动学人体运动合成,TP391.41
- 基于内容的网页恶意代码检测的研究与实现,TP393.092
- 学术主页信息抽取系统的研究,TP393.092
- Web挖掘技术在电子商务推荐系统中的研究与应用,TP391.3
- 数据挖掘在邮件反垃圾系统中的应用,TP393.098
- 个性化医疗信息推荐系统的研究与实现,R319
- 基于自学习的社会关系抽取的研究,TP391.1
- 基于GPU的图书推荐系统研究与实现,TP391.3
- 基于统计与图模型的若干机器学习算法及其应用,TP181
- P2P流量识别方法研究,TP393.06
- 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
- 基于SIFT特征和SVM的场景分类,TP391.41
- 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|