学位论文 > 优秀研究生学位论文题录展示

基于加权信息熵相似度的协同过滤算法研究

作 者: 刘文龙
导 师: 张桂芸
学 校: 天津师范大学
专 业: 计算机应用技术
关键词: 加权信息熵 相似度计算 协同过滤 推荐系统
分类号: TP391.3
类 型: 硕士论文
年 份: 2013年
下 载: 31次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息技术和万维网的迅猛发展,网络上的信息与资源呈现指数级的增长,人们从信息缺乏的时代逐步走入了信息过载的时代。在这个时代,无论信息的生产者还是信息的消费者都遇到了巨大的挑战:对于信息的产生者,如何让自己的信息在海量数据中脱颖而出,被广大消费者所关注,是一件非常困难的事情;而对于信息消费者,如何从海量信息中找到自己感兴趣的信息,也是比较困难的。推荐系统作为一种智能个性化信息服务系统,其可借助用户建模技术建模,再根据用户模型通过一定的推荐策略实现有针对性的个性化推荐,是解决信息过载的有效手段,在电子商务、新闻阅读、视频影视和数字图书馆等领域得到了广泛应用。在推荐系统技术中,协同过滤推荐算法因易于理解、易于建模和推荐效果明显等优点,是应用最广泛、研究最热门的技术。在目前协同过滤推荐系统中用户评分数据大都稀疏的背景下,本文以进一步提高协同过滤算法的推荐精度为目标,主要研究内容和工作如下:1)回顾了推荐系统的发展历史与研究现状,重点阐述了协同过滤算法的推荐步骤,详细介绍了协同过滤的两个分类:基于内存的协同过滤和基于模型的协同过滤,总结了协同过滤算法存在的问题与挑战。2)相似度计算作为协同过滤最为核心的步骤,本文着重针对相似度计算环节进行研究。发现在数据普遍稀疏的情况下,传统相似度计算方法容易夸大或缩小相似性,造成推荐结果不准确的问题。3)在分析了传统相似度计算方法出现问题的成因后,提出了一种新的相似度计算方法:基于信息熵的相似度计算方法,通过计算评分差值的信息熵来计算相似度。4)考虑到用户评分差异和用户评价的交叠程度对相似度的影响,将评分差异和交叠程度加权到信息熵计算公式中,并做归一化处理,形成了基于加权信息熵的相似度计算方法。5)利用MovieLens数据集,通过多次实验对多个评价指标进行验证。实验结果表明,基于加权信息熵的相似度计算方法缓解了传统相似度计算方法不精确的问题,提高了推荐精度和质量。

全文目录


摘要  4-6
Abstract  6-10
第1章 绪论  10-16
  1.1 研究背景及意义  10-11
  1.2 国内外研究现状  11-14
  1.3 论文主要工作  14-15
  1.4 论文组织结构  15-16
第2章 个性化推荐系统协同过滤算法  16-30
  2.1 基于内容的推荐  16-18
  2.2 协同过滤推荐  18-28
    2.2.1 协同过滤的推荐步骤  19-23
    2.2.2 基于内存的协同过滤  23-25
    2.2.3 基于模型的协同过滤  25-26
    2.2.4 协同过滤存在的挑战  26-28
  2.3 基于社交网络的推荐  28-29
  2.4 本章小结  29-30
第3章 基于加权信息熵相似度的协同过滤算法研究  30-44
  3.1 现有相似度计算方法  30-38
    3.1.1 传统的相似度计算方法  30-32
    3.1.2 相似度计算方法研究现状  32-37
    3.1.3 传统相似度算法出现的问题  37-38
  3.2 基于加权信息熵的相似度计算方法  38-43
    3.2.1 信息熵  38-39
    3.2.2 基于加权信息熵相似度算法提出的动机  39-40
    3.2.3 基于加权信息熵相似度算法的设计  40-42
    3.2.4 基于加权信息熵相似度算法分析与说明  42-43
  3.3 本章小结  43-44
第4章 基于加权信息熵相似度算法实验设计与结果分析  44-51
  4.1 实验数据集  44
  4.2 评测指标  44-46
  4.3 实验方案与评估  46
  4.4 实验结果及分析  46-50
  4.5 本章小结  50-51
第5章 总结与展望  51-53
  5.1 本文工作总结  51
  5.2 未来工作展望  51-53
参考文献  53-58
攻读硕士期间发表的论文  58-59
致谢  59

相似论文

  1. 多邮件自动文摘的关键技术研究,TP391.1
  2. 基于相似度计算的编程题自动评判方法研究,TP312.1
  3. 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
  4. 基于本体的食品投诉文档文本分类研究,TP391.1
  5. 基于文本相似度计算的主观题自动阅卷技术研究,TP391.1
  6. 基于自然遗忘的个性化推荐算法研究,TP311.52
  7. 基于大众标注的个性化推荐系统研究,TP393.09
  8. 协同过滤推荐系统中关键问题研究与实现,TP311.52
  9. 能力导向终身学习个性化推荐系统学习者模型构建,G720
  10. 面向终身学习的能力导向个性化推荐系统中资源的建设与共享机制研究,G720
  11. 面向电子商务的Web数据挖掘应用研究,TP311.13
  12. 改进的协同过滤算法在推荐系统中的研究,TP391.3
  13. 基于球面调和的三维模型检索系统研究与实现,TP391.41
  14. Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
  15. 农业知识推送模型及向量特征项提取算法研究,F320.1
  16. 电子商务个性化推荐系统的研究,F713.36
  17. 终身学习个性化推荐系统中学习者个人能力发展研究,G77
  18. Web数据挖掘在网上书店个性化推荐系统中的应用研究,TP391.3
  19. 现代远程教育系统个性化推荐算法研究,TP391.6
  20. 短文本指纹的研究,TP391.1
  21. 基于协同过滤的电子商务个性化推荐系统的研究与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com