学位论文 > 优秀研究生学位论文题录展示

基于模范用户的协同过滤算法研究

作 者: 彭晋
导 师: 傅鹤岗
学 校: 重庆大学
专 业: 计算机软件与理论
关键词: 电子商务 协同过滤 模范用户 聚类有效性验证指标
分类号: TP301.6
类 型: 硕士论文
年 份: 2010年
下 载: 63次
引 用: 1次
阅 读: 论文下载
 

内容摘要


电子商务大行其道的时代,人们需要的不再是简单的信息提供,而是有针对性的信息推荐。众多个性化推荐技术中协同过滤可谓一枝独秀,该算法引领了当今各大电子商务平台的推荐系统的发展趋势。但随着电子商务行业规模不断发展壮大,无论是用户还是商品的数量呈现指数级增长,同时用户对电子商务推荐所提供服务的要求也越来越高。协同过滤技术在面对当前的挑战时暴露出许多有待解决的瓶颈问题。针对存在的这些问题,国内外的研究机构和学者不断地探索改进方案。本文深入分析比较了协同过滤算法及当前主要的改进算法。提出基于模范用户的协同过滤算法。模范用户的概念类似于现实生活中的劳动模范或标兵。在某个领域或行业起到模范带头作用,也是其他人效仿和学习的榜样。将这样一个概念引入到协同过滤推荐算法中,主要目的是希望建立一个有较好稳定性的模范用户模型,该模型中的用户能反映其所在的一个或多个领域内用户的兴趣爱好,协同模范用户推荐出的商品应该是准确和可信赖的。该模型的建立对于缓解协同过滤技术中存在的稀疏性问题、推荐的实时性问题有很大的帮助。同时稳定的模范用户模型也可以应对电子商务平台快速增长的用户和商品数量的挑战。本文通过对用户-项目评价矩阵中的用户聚类,在每个类中生成一个模范用户评分向量。模范用户并不是聚类的中心,而是按照一定的生成规则生成的虚拟用户。该组用户增大了类内用户的评分密度,反映了类内用户整体评价趋势。聚类技术通常必须指定一个聚类个数,这样给出的聚类结果是否合理,是否真正反映了用户群的分类就需要进行聚类有效性的验证。本文通过DB指标对普通C均值聚类算法的聚类效果进行验证,当DB指标取到极小值时聚类迭代结束,获得最优聚类粒度;通过分割系数PC对模糊C均值聚类进行有效性验证,当聚类自适应函数值取到极大值时获得最优聚类粒度。对于两种聚类算法均实现了自适应聚类粒度的确定。实验表明:聚类数自适应算法可以取得有效性验证指标的局部最优值,既最优聚类效果。对在此基础上生成的模范用户模型应用协同过滤推荐算法,目标用户在线推荐的效率有很大的提高,模范用户模型相对稳定,推荐精度也有所改善。

全文目录


中文摘要  3-4
英文摘要  4-8
1 绪论  8-14
  1.1 研究背景及意义  8-9
  1.2 电子商务推荐系统的研究内容及现状  9-11
    1.2.1 电子商务推荐系统的研究内容  9-10
    1.2.2 国内外现状  10-11
  1.3 研究意义  11-12
  1.4 本文研究的目的和内容  12-13
    1.4.1 本文研究的目的  12
    1.4.2 本文研究的内容  12-13
  1.5 论文组织结构  13-14
2 电子商务个性化推荐技术  14-30
  2.1 个性化推荐系统概述  14-18
    2.1.1 推荐系统的数据源  14-15
    2.1.2 推荐系统的推荐结果  15
    2.1.3 主要推荐系统算法介绍  15-18
  2.2 电子商务协同过滤推荐技术  18-29
    2.2.1 协同过滤算法  19-24
    2.2.2 传统协同过滤算法优缺点分析  24-25
    2.2.3 相关改进算法  25-29
  2.3 本章小结  29-30
3 基于模范用户的协同过滤推荐系统设计  30-42
  3.1 问题的提出  30-31
  3.2 相关概念描述  31
    3.2.1 模范用户  31
    3.2.2 模范用户粒度  31
  3.3 训练模范用户  31-33
    3.3.1 划分训练  31
    3.3.2 覆盖训练  31-32
    3.3.3 模范用户生成规则  32-33
  3.4 有效性判断  33-39
    3.4.1 Davies-Bouldin(DB)指标  33-34
    3.4.2 分割系数PC(Partition Coefficient)  34
    3.4.3 模范用户粒度(k 值)选取过程  34-39
  3.5 基于模范用户的协同过滤推荐流程  39-41
  3.6 本章小结  41-42
4 实验  42-49
  4.1 实验目的  42
  4.2 实验数据集及实验环境  42-43
  4.3 评估指标  43
  4.4 实验方案  43-44
  4.5 实验结果及分析  44-48
    4.5.1 实验1  44-46
    4.5.2 实验2  46
    4.5.3 实验3  46-48
  4.6 本章小结  48-49
5 总结与展望  49-51
  5.1 本文工作总结  49
  5.2 下一步工作及展望  49-51
致谢  51-52
参考文献  52-55
附录 作者在攻读学位期间发表的论文目录  55

相似论文

  1. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  2. 服装网络营销顾客忠诚度的实证研究,F274
  3. 中等职业学校语文课业设计的思考与实践,G633.3
  4. 论《联合国国际货物销售合同公约》在适用范围上的新发展,D997.1
  5. B2C市场中价格和价格离散的实证研究,F724.6
  6. 基于自然遗忘的个性化推荐算法研究,TP311.52
  7. 基于Hadoop的在线购物原型系统的设计与实现,TP311.52
  8. 山东邮政电子商务发展战略研究,F616
  9. 几个电子现金支付方案的分析与改进,TP393.08
  10. 关于设立上海电子商务银行的可行性研究,F832.2
  11. 电子贸易全球化背景下的税收征管研究,F812.42
  12. 电子商务系统开发运用法律问题探讨,D923.6
  13. 在线相册冲印系统的设计与实现,TP311.52
  14. 龙城电子商城购物系统的设计与实现,TP311.52
  15. 基于Google平台促销模块与商品模块的设计与实现,TP311.52
  16. 支持精细化营销的B2C平台的设计与开发,TP311.52
  17. 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
  18. 网络音像交易平台设计与实现,TP393.09
  19. 电子商务技术扩散水平影响因素实证研究,F224
  20. 基于MVC架构的电子商务平台的设计与实现,TP311.52
  21. EM2C企业的作假监管和物流投资的实物期权分析,F252;F713.36

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com