学位论文 > 优秀研究生学位论文题录展示

协同过滤推荐系统关键问题研究

作 者: 孔维梁
导 师: 杨宗凯; 刘清堂
学 校: 华中师范大学
专 业: 教育技术学
关键词: 推荐系统 协同过滤 稀疏性 冷启动 扩展性 评价指标
分类号: TP391.3
类 型: 博士论文
年 份: 2013年
下 载: 185次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络的迅速发展,人类进入了信息社会和网络时代,Internet正为人们提供越来越多的信息和服务。互联网打破了人们传统生活和学习的时空限制,人们可以方便的在互联网上购物,也可以随时随地通过互联网进行学习。但是人们在享受Internet带来的便利的同时,也不得不面对浩如烟海的数据以及大量的垃圾信息,这就带来了著名的“信息过载”和“信息迷航”问题。个性化推荐系统此时应运而生,它能够感知用户的兴趣或需求,而后实现个性化的资源推荐,有效的解决了“信息过载”和“信息迷航”问题。在个性化推荐系统中,协同过滤算法是目前最成功也是应用最广泛的技术之一,但随着用户数的增加以及系统规模的扩大,协同过滤技术面临诸多挑战。本文以协同过滤技术为主要研究目标,从用户使用的角度出发,选择对用户使用有严重影响的关键问题进行深入的探讨和研究,旨在改善协同过滤算法所面临的稀疏性、用户冷启动以及扩展性等问题。针对上述问题,论文在以下几个方面开展理论研究与实践工作:1)针对传统基于项目的协同过滤算法在数据稀疏时的较高预测准确度而低推荐精度的问题,本文提出了基于相关度协同过滤算法(Relation-based Collaborative Filtering, RBCF)。首先,指出传统算法产生候选项目集的不合理,引入关联规则思想,根据项目关联关系生成项目关联矩阵,并使用项目关联矩阵生成候选项目集;然后,针对数据稀疏情况下相似度准确性较差的问题,提出了修正的Pearson相关系数,进一步提高了相似度的准确性;最后,实验证明在评分矩阵相当稀疏的情况下,本文提出的算法能够明显提高推荐质量。同时,该算法大大降低了候选项目集的规模,在一定程度上缓解了算法的扩展性问题。2)详细分析了传统基于项目的协同过滤算法在面对新用户冷启动问题时,待预测项目的近邻数不足等问题,提出了一种基于局部填充的协同过滤算法(Filling-based Collaborative Filtering, FBCF)。算法使用局部最大可能性填充方法扩展新用户的已评分项目集,以便为待预测项目提供较多的近邻。与传统填充算法不同,本文方法不需要额外的用户或项目的属性信息。最后,实验结果证明本文提出的算法能够有效改善新用户冷启动问题。3)随着用户数的增加以及系统规模的扩大,协同过滤算法还面临着严重的扩展性问题。基于专家的协同过滤算法提供了一种新的解决思路,能够在保证相对较高的预测准确度和推荐精度的同时,较为有效地解决扩展性问题。但是,也带来了新的问题——如何有效地选择专家。为此,本文提出了一种基于聚类选择专家的协同过滤算法(Collaborative Filtering Algorithm Incorporated with Cluster-based Expert Selection, CBES)。该算法首先对专家进行了重定义,将专家映射为简单易测量的度量;然后引入聚类方法将项目空间分成不同领域,从每个领域对应用户中选择出代表组成专家集;最后,实验结果表明在预测准确度和推荐精度上,本文提出的算法取得了较好的效果。4)在前文所作研究的基础上,本文探讨了面向适应学习服务的协同过滤系统研究与实现,文章设计并实现了基于村镇教育平台的协同过滤推荐系统(Recommendation System for Country Education Platform, CEPRS)。系统综合实现了本文提出的算法,为在线学习用户提供了个性化服务,使得在线教育平台在用户中心化上前进了一大步。文章介绍了系统的体系结构和主要功能模块,并对算法的实现进行了简要说明,另外,该系统具有良好的可移植性、可维护性及开放式架构的特征。

全文目录


摘要  5-7
Abstract  7-15
1 绪论  15-28
  1.1 研究背景  15-17
    1.1.1 信息检索与信息过滤  15-16
    1.1.2 个性化推荐系统协同过滤技术  16-17
  1.2 国内外研究现状  17-24
    1.2.1 国内研究现状  17-19
    1.2.2 国外研究现状  19-24
  1.3 课题的主要研究内容及意义  24-26
    1.3.1 协同过滤面临的问题与挑战  24-25
    1.3.2 本文的研究工作  25-26
  1.4 论文结构  26-28
2 相关工作  28-54
  2.1 个性化推荐系统的一般框架  28-29
  2.2 协同过滤算法  29-45
    2.2.1 协同过滤算法概述  29-32
    2.2.2 协同过滤算法分类  32-33
    2.2.3 基于用户的协同过滤算法  33-38
    2.2.4 基于项目的协同过滤算法  38-43
    2.2.5 基于模型的协同过滤算法  43-45
  2.3 其它个性化推荐技术  45-47
    2.3.1 基于内容的推荐技术  45-46
    2.3.2 组合推荐技术  46-47
  2.4 数据集与评价指标  47-53
    2.4.1 数据集  47-48
    2.4.2 评价方式与评价指标  48-53
  2.5 本章小结  53-54
3 基于相关度的稀疏性问题研究  54-73
  3.1 相关研究  54-56
  3.2 基于相关度的协同过滤算法  56-64
    3.2.1 问题分析  57-59
    3.2.2 基于关联度的协同过滤算法  59-61
    3.2.3 相似度改进  61-63
    3.2.4 推荐产生及算法流程  63-64
  3.3 实验结果及分析  64-72
    3.3.1 数据预处理  64-65
    3.3.2 实验结果及分析  65-72
  3.4 本章小结  72-73
4 基于局部填充的用户冷启动问题研究  73-85
  4.1 相关研究  73-74
  4.2 基于局部填充的协同过滤算法  74-78
    4.2.1 问题分析  74-75
    4.2.2 局部填充方法  75-77
    4.2.3 推荐产生及算法流程  77-78
  4.3 实验结果及分析  78-84
    4.3.1 数据预处理  78-79
    4.3.2 相似度公式的选取  79-80
    4.3.3 实验结果及分析  80-84
  4.4 本章小结  84-85
5 基于聚类专家选择的可扩展性问题研究  85-94
  5.1 相关研究  85-87
  5.2 基于聚类的专家选择算法  87-88
    5.2.1 基于专家的协同过滤算法  87-88
    5.2.2 基于聚类的专家选择  88
  5.3 实验结果及分析  88-93
    5.3.1 实验数据  88-90
    5.3.2 实验结果及分析  90-93
  5.4 本章小结  93-94
6 面向适应学习服务的协同过滤系统研究与实现  94-109
  6.1 系统设计  94-99
    6.1.1 系统体系结构  94-96
    6.1.2 系统功能模块设计  96-99
  6.2 系统实现  99-105
    6.2.1 相关环境及技术  99
    6.2.2 用户行为记录与分析  99-101
    6.2.3 算法库与综合Item-based CF算法实现  101-104
    6.2.4 算法库与基于聚类的专家选择算法实现  104-105
    6.2.5 算法配置模块  105
  6.3 系统效果与分析  105-108
    6.3.1 系统效果  105-106
    6.3.2 系统功能比较  106-107
    6.3.3 系统性能分析  107-108
  6.4 本章小结  108-109
7 总结与展望  109-112
  7.1 总结  109-110
  7.2 展望  110-112
参考文献  112-122
攻读博士研究生期间发表的论文和科研成果  122-123
致谢  123

相似论文

  1. 高校绿色办公指标体系的设计与评价研究,G647
  2. 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
  3. 高校体育教育专业健美操专修学生创编能力的评价指标体系构建,G831.3
  4. 西安市青少年健身效果评价方法初探,G804.49
  5. 数字图书馆信息资源开发利用中的著作权集体管理研究,D923.41
  6. 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
  7. 重庆高技术产业竞争力研究,F276.44
  8. 大型灌区节水改造综合效益评价研究-以甘肃大型灌区节水改造项目为例,S274
  9. 苏州市经营型健身俱乐部瑜伽教练服务质量评价指标体系研究,G806
  10. 基于自然遗忘的个性化推荐算法研究,TP311.52
  11. 协同过滤推荐系统中关键问题研究与实现,TP311.52
  12. 面向数字图书馆的信息网络传播权优化研究,D923.41
  13. 我国上市商业银行竞争力评价的实证研究,F224
  14. 海洋数据仓库架构及接口规范的设计与实现,TP311.13
  15. P2P重叠网的研究与设计,TP393.02
  16. 基于高校网络教学平台的学习绩效评价研究,G434
  17. 最小二乘支持向量机建模及预测函数控制问题研究,TP13
  18. 网络学习的过程性评价研究,G434
  19. 基于OVM的SoC功能验证系统的设计与实现,TN47
  20. 基于随机游走模型的个性化信息推荐,TP391.3
  21. 基于C2C电子商务模式下商品推荐系统应用研究,F724.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com