学位论文 > 优秀研究生学位论文题录展示

结合潜在属性的协同过滤模型研究

作 者: 李昂
导 师: 钟将
学 校: 重庆大学
专 业: 计算机软件与理论
关键词: 推荐系统 协同过滤 概率潜在语义分析 潜在属性
分类号: TP391.3
类 型: 硕士论文
年 份: 2013年
下 载: 16次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络日益普及和使用电子商务平台进行购物的用户越来越多,电商的商品种类和信息也越来越庞大,海量的商品和平台信息往往消耗掉网购用户大量的时间和精力进行查找商品或检索相关信息。对于电商,也会因为其不良用户体验而导致客户量的减少。为了减小在海量信息面前用户的负担,使得信息被更加高效的发掘和利用,个性化推荐系统的概念被提出、研究、实践和发展,当前已被开发出多种推荐算法,并使用在不同的场合下来帮助电子商务网站为顾客提供个性化的信息服务和决策支持。另外,推荐系统也广泛的被应用到其他各类信息及社交平台,为用户动态地推荐其所感兴趣的对象,例如电影、书籍等,甚至可以进行跨领域的推荐,从而可以广泛并深入的挖掘用户的兴趣点及喜好,使得用户对相应信息平台的使用更加充分,同时也增加了用户对系统的忠诚度。本文首先从宏观上对推荐系统的含义、构造、作用进行介绍,针对核心的推荐算法进行研究、改进,从准确率上对算法的优化结果进行验证。协同过滤是当前被广泛应用的一种推荐算法,它具有较好推荐的准确性、多样性及拓展性。协同过滤包含以模型为基础的协同过滤和以内存为基础的协同过滤两大类算法,其中,基于内存的算法又包括基于项目与基于用户两种。但它们存在共有的缺点是数据稀疏,难以处理大数据量影响即时结果,因此发展出基于模型的协同过滤算法。该算法是先通过历史数据学习得到预测模型,再利用该模型进行预测。虽然协同过滤作算法在当前电子商务中应用广泛,协同过滤算法仍然存在着一些缺陷,其主要的缺点有:推荐的准确度问题、可扩展性问题、实时性问题、冷启动问题。为了克服协同过滤算法中存在的弊病,本文提出了一个基于学习分类预测模型的统一模型(结合潜在属性的协同过滤模型),它统一了用户和项目的外部属性和潜在属性来提供更加准确的推荐服务。将协同过滤推荐问题映射到文本分析处理问题,利用概率潜在语义分析PLSA来分析用户历史评分数据,并计算用户和项目的潜在属性。该方法分两个步骤:第一步,使用历史评分数据来计算获取用户和项目的潜在属性;第二步,使用传统的近似函数学习模型(例如人工神经网络)在潜在属性空间中来建立评分函数。相比标准的基于内存的推荐方法,该方法的主要优势在于更高的推荐准确度,预测时间为常量级别,以及更清晰和简洁的模型表现。实验评估结果表面了该模型比以往推荐方法的具有较大的提高。

全文目录


摘要  3-5
ABSTRACT  5-9
1 绪论  9-15
  1.1 信息检索与信息过滤  9
  1.2 研究背景及意义  9-11
  1.3 推荐系统的研究内容和研究现状  11-13
    1.3.1 推荐系统的主要研究内容  11-12
    1.3.2 国内国外研究现状  12-13
  1.4 本文的主要研究内容  13-14
  1.5 文章结构  14-15
2 推荐系统及相关技术  15-23
  2.1 推荐系统的结构  15-18
  2.2 推荐系统的算法  18-22
    2.2.1 基于规则的推荐  18-19
    2.2.2 基于内容的推荐  19-20
    2.2.3 基于协同过滤的推荐  20-22
  2.3 各种算法的比较  22
  2.4 本章小结  22-23
3 协同过滤推荐算法  23-30
  3.1 协同过滤原理  23
  3.2 协同过滤算法分类  23-24
  3.3 基于模型的协同过滤算法  24-26
    3.3.1 基于聚类的协同过滤  24-25
    3.3.2 基于 pLSA 的协同过滤  25-26
  3.4 基于内存的协同过滤算法  26-28
    3.4.1 基于用户的协同过滤算法  26-27
    3.4.2 基于项目的协同过滤算法  27-28
  3.5 协同过滤存在的主要问题  28-29
  3.6 本章小结  29-30
4 结合潜在属性的协同过滤模型  30-40
  4.1 基于模型的推荐系统  30
  4.2 结合潜在属性的协同过滤模型引入  30-33
  4.3 挖掘用户和项目的潜在属性  33-36
    4.3.1 概率潜在语义分析(pLSA)  33-35
    4.3.2 利用 pLSA 挖掘潜在属性  35-36
  4.4 计算用户和项目的潜在属性  36-39
    4.4.1 EM 算法介绍  36-38
    4.4.2 利用 EM 算法进行模型求解  38-39
  4.5 本章小结  39-40
5 实验  40-49
  5.1 实验原理  40-42
    5.1.1 BP 神经网络  40-41
    5.1.2 评价指标  41-42
  5.2 数据集和实验设置  42-43
    5.2.1 数据集  42-43
    5.2.2 实验设置  43
  5.3 实验过程及结果分析  43-48
  5.4 本章小结  48-49
6 总结与展望  49-51
  6.1 总结  49
  6.2 展望  49-51
致谢  51-52
参考文献  52-55
附录  55
  A. 作者在攻读硕士学位期间发表的论文目录  55
  B. 作者在攻读硕士学位期间参加的科研项目  55

相似论文

  1. 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
  2. 基于自然遗忘的个性化推荐算法研究,TP311.52
  3. 基于大众标注的个性化推荐系统研究,TP393.09
  4. 协同过滤推荐系统中关键问题研究与实现,TP311.52
  5. 能力导向终身学习个性化推荐系统学习者模型构建,G720
  6. 面向终身学习的能力导向个性化推荐系统中资源的建设与共享机制研究,G720
  7. 面向电子商务的Web数据挖掘应用研究,TP311.13
  8. 改进的协同过滤算法在推荐系统中的研究,TP391.3
  9. 农业知识推送模型及向量特征项提取算法研究,F320.1
  10. 电子商务个性化推荐系统的研究,F713.36
  11. 终身学习个性化推荐系统中学习者个人能力发展研究,G77
  12. Web数据挖掘在网上书店个性化推荐系统中的应用研究,TP391.3
  13. 现代远程教育系统个性化推荐算法研究,TP391.6
  14. 基于协同过滤的酒店推荐系统研究与实现,TP391.3
  15. 基于用户行为数据分析的移动互联业务推荐模型,TP311.13
  16. 基于协同过滤的电子商务个性化推荐系统的研究与实现,TP311.52
  17. 基于Petri网的推荐系统的研究与分析,TP391.3
  18. 基于蚁群算法的移动商务个性化推荐体系研究,TP391.3
  19. 基于网络结构的个性化推荐系统的研究,TP391.3
  20. 社交网络中基于话题的影响最大化问题研究,TP393.09
  21. 面向情感的电影背景音乐分类方法研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com