学位论文 > 优秀研究生学位论文题录展示
电子商务推荐系统中用户聚类问题与用户兴趣变化问题研究
作 者: 寇艳艳
导 师: 王卫平
学 校: 中国科学技术大学
专 业: 管理科学与工程
关键词: 电子商务 推荐系统 协同过滤 蚁群聚类 金字塔时间框架
分类号: F224
类 型: 硕士论文
年 份: 2011年
下 载: 309次
引 用: 0次
阅 读: 论文下载
内容摘要
协同过滤推荐技术是推荐系统中应用最广泛的一种技术,然而随着系统规模的逐步扩大,该技术使推荐系统的实时性与推荐精确性面临极大的挑战。针对实时性问题,基于K-Means用户聚类的协同过滤技术将算法分为离线和在线两个部分,离线部分将用户进行K-Means聚类形成簇,在线部分寻找用户所在簇并进行推荐。该方法使系统的实时性得到改善,但是本身却存在缺陷:算法需要初始划分并且初始划分的优劣直接决定聚类结果的好坏,另外算法聚类结果存在局部最优性,而这些缺陷势必影响算法的性能。于是,为了克服这些问题,本文提出了使用AntClass蚁群算法对用户进行聚类,该算法不仅不需要任何初始信息,而且算法参数设置简单,所以规避了算法本身的复杂性,使聚类过程更符合实际应用情况,聚类结果更合理。系统规模扩大给系统带来的另一个问题是用户的兴趣爱好可能会随着时间推移而发生变化。如果像传统协同过滤推荐技术那样使用所有历史评分数据,可能会影响推荐的质量,因为用户在很久之前的评分可能不再具有预测价值。针对这个问题,本文提出了将系统中的评分数据看成数据流,利用金字塔时间框架存储方式对其进行数据筛选,从而使历史信息中离当前时间越远的数据利用率越低,离当前时间越近的数据利用率越高。综上所述,本文针对系统中的数据流利用金字塔时间框架进行存储,再利用AntClass蚁群算法对用户进行聚类,形成基于AntStream用户聚类的协同过滤推荐系统。通过对比性实验证明,该算法能在保证实时性的基础上,明显的提高推荐质量。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第1章 绪论 9-14 1.1 研究背景与意义 9-10 1.2 推荐系统的研究热点 10-12 1.2.1 数据稀疏性问题 10 1.2.2 推荐精确性问题 10-11 1.2.3 推荐实时性问题 11 1.2.4 算法的评价准则问题 11 1.2.5 基于tag 的推荐系统 11 1.2.6 系统安全性问题 11-12 1.3 论文研究对象与所做工作 12-13 1.4 论文结构安排 13 1.5 小结 13-14 第2章 电子商务推荐系统及相关技术 14-24 2.1 推荐系统中的推荐问题 14-15 2.2 推荐系统中的推荐技术 15-22 2.2.1 基于内容的推荐 15-17 2.2.2 协同过滤推荐 17-20 2.2.3 基于人口统计的推荐 20 2.2.4 基于知识的推荐 20-21 2.2.5 混合方法 21-22 2.3 基于K-Means 用户聚类的协同过滤技术 22-23 2.4 小结 23-24 第3章 蚁群聚类与金字塔时间框架相关技术 24-29 3.1 蚁群聚类相关技术 24-25 3.2 金字塔时间框架相关技术 25-28 3.2.1 金字塔时间框架的来源 25-26 3.2.2 金字塔时间框架的原理 26-27 3.2.3 金字塔时间框架举例说明 27-28 3.3 小结 28-29 第4章 基于 AntStream 用户聚类的协同过滤技术 29-39 4.1 AntStream 算法初始化部分 29-31 4.1.1 问题描述 29-30 4.1.2 问题处理 30 4.1.3 实施步骤 30-31 4.2 AntStream 算法离线部分 31-38 4.2.1 AntClass 蚁群聚类算法中的基本概念 31-33 4.2.2 AntClass 蚁群聚类算法的步骤 33-37 4.2.3 计算相似度 37-38 4.3 AntStream 算法在线部分 38 4.4 小结 38-39 第5章 实验设计及结果分析 39-45 5.1 数据集 39-40 5.2 度量标准 40 5.3 实验过程 40-42 5.4 实验结果及其分析 42-44 5.4.1 精确性检验 42-43 5.4.2 实时性检验 43-44 5.5 小结 44-45 第6章 结束语 45-47 6.1 本文工作 45 6.2 后续工作 45-47 参考文献 47-50 致谢 50-51 攻读硕士学位期间发表的学术论文 51
|
相似论文
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 蚁群算法及其在气象卫星云图分割中的应用,TP391.41
- 服装网络营销顾客忠诚度的实证研究,F274
- 中等职业学校语文课业设计的思考与实践,G633.3
- 论《联合国国际货物销售合同公约》在适用范围上的新发展,D997.1
- B2C市场中价格和价格离散的实证研究,F724.6
- 基于自然遗忘的个性化推荐算法研究,TP311.52
- 结合蚁群算法与基于划分的DBSCAN聚类算法的研究,TP311.13
- 基于Hadoop的在线购物原型系统的设计与实现,TP311.52
- 山东邮政电子商务发展战略研究,F616
- 几个电子现金支付方案的分析与改进,TP393.08
- 关于设立上海电子商务银行的可行性研究,F832.2
- 电子贸易全球化背景下的税收征管研究,F812.42
- 电子商务系统开发运用法律问题探讨,D923.6
- 在线相册冲印系统的设计与实现,TP311.52
- 龙城电子商城购物系统的设计与实现,TP311.52
- 基于Google平台促销模块与商品模块的设计与实现,TP311.52
- 支持精细化营销的B2C平台的设计与开发,TP311.52
- 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
- 网络音像交易平台设计与实现,TP393.09
- 电子商务技术扩散水平影响因素实证研究,F224
中图分类: > 经济 > 经济计划与管理 > 经济计算、经济数学方法 > 经济数学方法
© 2012 www.xueweilunwen.com
|