学位论文 > 优秀研究生学位论文题录展示

基于电阻网络与稀疏数据预测的协同过滤算法研究

作 者: 马骋
导 师: 庄越挺;吴江琴
学 校: 浙江大学
专 业: 计算机应用技术
关键词: 数字图书馆 个性化推荐 协同过滤 相似度计算 电阻网络 数据稀疏性 数据预测
分类号: G250.76
类 型: 硕士论文
年 份: 2008年
下 载: 69次
引 用: 0次
阅 读: 论文下载
 

内容摘要


CADAL数字图书馆巾存放了海量数字内容,用户在访问数字图书馆的过程中经常面临着信息过载的问题。CADAL门户上为用户提供了一批个性化服务,其中个性化推荐服务是帮助用户克服信息过载的重要手段,大为减少用户寻找信息时候花费的时间与精力。应用于个性化推荐系统的协同过滤技术在过去的十年中获得了长足发展,但是仍然存在着二大类问题:一、用户间或物品间相似度计算方法单一,多是简单的向量运算;二、系统收集的评分数据稀疏时,常见的基于记忆的推荐系统效果不佳,尤其是在系统运行初期时候,还有冷启动的问题。本文的主要工作如下:一、采用了一种新颖的基于电阻网络模型的相似度计算方法。用户与物品可被视为电阻网络中的节点,用户给物品评分就构成电阻网络上的通路,评分值即为电导,则与物理电阻网络类似,可以利用线性方程组来求取用户节点间的相似度或者物品节点间的相似度。二、给出一种有效的稀疏数据预测算法:集成使用物品间相似度与用户间相似度,有选择性地预测较有把握的缺失评分,在扩大后的评分集合基础上预测最终的用户评分。三、实现了基于电阻网络模型的协同过滤算法Electrical Resistance Network Model forCollaborative Filtering(ERCF)。考虑到CADAL网站上收集评分数目不多,我们在著名的MovieLens评分数据集上进行了详细实验,实验结果表明ERCF在准确度上超过其他被测试的方法,有选择性地预测缺失评分可以显著提高推荐算法的准确度。

全文目录


摘要  3-4
Abstract  4-10
第1章 绪论  10-15
  1.1 课题背景  10-11
  1.2 研究现状  11-12
  1.3 本文的主要工作  12-13
  1.4 本文内容的组织结构  13-15
第2章 CADAL与个性化推荐技术  15-28
  2.1 百万册数字图书馆项目  15-17
  2.2 个性化推荐技术概述  17-21
    2.2.1 个性化技术提出的背景  17-18
    2.2.2 主要技术  18-21
  2.3 CADAL中的个性化服务  21-27
    2.3.1 用户基本服务  22-23
    2.3.2 收藏  23-24
    2.3.3 书签  24-25
    2.3.4 规则  25-27
  2.4 本章小结  27-28
第3章 协同过滤技术概述  28-34
  3.1 协同过滤技术简介  28
  3.2 协同过滤技术的优缺点  28-29
  3.3 主要算法  29-32
    3.3.1 基于记忆的算法  29-31
    3.3.2 基于模型的算法  31-32
  3.4 相关概念  32-33
    3.4.1 评分刻度  32-33
    3.4.2 数据归一化  33
  3.5 本章小结  33-34
第4章 基于电阻网络模型的相似度计算  34-47
  4.1 评分图  34-37
    4.1.1 定义  34-35
    4.1.2 评分图的作用  35
    4.1.3 相似度计算必须符合的三大条件  35-36
    4.1.4 与Pearson Correlation Coefficient(PCC)相比较  36-37
  4.2 电阻距离—相似度的计算  37-39
  4.3 负评分值的影响  39-41
  4.4 Y-△简化  41-46
  4.5 本章小结  46-47
第5章 预测评分  47-54
  5.1 选择相似的邻居  48-49
  5.2 稀疏数据的预测算法  49-51
  5.3 预测评分  51-52
  5.4 关于重要参数的讨论  52-53
  5.5 本章小结  53-54
第6章 实验设计与结果分析  54-60
  6.1 数据集  54-55
  6.2 评价标准  55
  6.3 与其他算法,模型比较  55-56
  6.4 预测稀疏数据的作用  56-59
  6.5 本章小结  59-60
第7章 总结与展望  60-62
  7.1 总结  60
  7.2 展望  60-62
参考文献  62-65
致谢  65-67
作者简历  67

相似论文

  1. 多邮件自动文摘的关键技术研究,TP391.1
  2. 基于相似度计算的编程题自动评判方法研究,TP312.1
  3. 数字图书馆信息服务视域下的著作权问题研究,D923.41
  4. 基于云计算的数字图书馆服务模式研究,G250.76
  5. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  6. 基于自然遗忘的个性化推荐算法研究,TP311.52
  7. Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
  8. 面向用户偏好的MADM方法在个性化推荐中的应用,G353.1
  9. 基于Web挖掘技术研究及其在数字图书馆中的应用,G250.76
  10. 基于蚁群算法的移动商务个性化推荐体系研究,TP391.3
  11. 数字图书馆的著作权问题研究,G250.76
  12. 面向论坛信息文本的有效数据抽取研究,TP391.1
  13. 基于协同过滤的用户兴趣发现,TP391.3
  14. 基于信息型模型的音乐推荐算法,TP391.3
  15. 基于社会化标签体系的个性化推荐引擎技术研究,TP391.3
  16. 基于随机游走模型的个性化信息推荐,TP391.3
  17. 基于GPU的图书推荐系统研究与实现,TP391.3
  18. 商品热销度分析与展示,TP391.3
  19. 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
  20. 基于Agent元搜索引擎的个性化研究,TP391.3
  21. 面向概念查询的生物医学多文档摘要技术研究,TP391.1

中图分类: > 文化、科学、教育、体育 > 信息与知识传播 > 图书馆学、图书馆事业 > 图书馆学 > 图书馆自动化、网络化 > 电子图书馆、数字图书馆
© 2012 www.xueweilunwen.com