学位论文 > 优秀研究生学位论文题录展示
基于数据挖掘技术的电子商务个性化推荐系统的研究
作 者: 李素红
导 师: 戴仕明
学 校: 江西农业大学
专 业: 计算机应用技术
关键词: 电子商务 个性化推荐 数据挖掘 径向神经网络 协同过滤
分类号: TP391.3
类 型: 硕士论文
年 份: 2012年
下 载: 52次
引 用: 0次
阅 读: 论文下载
内容摘要
伴随着互联网技术和计算机技术的迅速发展,经济交易也由传统商务模式向电子商务模式转变。电子商务在很大程度上简化了传统的交易方式,为人们带来了很多便利。但随着时间推移,电子商务系统上积累的用户和产品越来越多,交易信息、访问日志等业务数据量也急剧增大。产品数量的激增为用户寻找到满意的商品增加了困难,在这样的一种背景之下,个性化推荐系统出现了,它改变了以往系统被动等待访问的特性,通过分析用户业务数据等信息主动为其推荐偏好产品。个性化推荐系统目前采用的推荐技术有很多种,但应用最为广泛的还是协同过滤推荐技术。相比其他推荐技术,协同过滤有更为突出的优势,比如它不需要专业知识、能处理非结构化项目等。当然任何事物都有两面性,CF推荐算法也是如此,它面临着一些问题,比如系统可扩展性差、冷启动、矩阵数据稀疏等等。这就是使用单一推荐算法的局限性,能为系统用户提供推荐但推荐质量却不高;为了弥补单一算法的缺陷,目前出现了一些组合推荐方式,如协同过滤算法与基于内容推荐算法的组合,数据挖掘技术与协同过滤的组合等。数据挖掘是从海量数据中寻找规律和共性,为商务决策提供依据,数据挖掘技术在电子商务的个性化推荐系统当中的应用也越来越受到人们的关注,目前在推荐系统当中使用的数据挖掘技术包括聚类分析、关联规则、人工神经网络、遗传算法等。文章改进部分用到的径向基函数网络就是人工神经网络的一种。本文的创新点在于提出了一种智能集成改进方案,方案包括算法设计和模型设计两个组成部分。算法设计是在传统协同过滤的基础之上,引入径向基函数网络,对原本稀疏的评分矩阵进行光滑处理,使其更复杂稠密,然后以处理过的矩阵为基础进行用户的聚类;模型设计部分则依据前一部分的用户聚类,从中找出当前用户的最积极邻居和最消极邻居,以此推断用户可能喜欢和不喜欢的项目,再将二者的差集推荐给用户。改进方案的推荐效果通过实验进行了测试,实验采用的数据集是BookCrossing数据集,评估方法是MAE和F值评估法,实验表明改进后的模型比传统协同过滤推荐模型和基于SVD的推荐模型推荐质量更好。改进方案在一定程度上解决了CF推荐算法遇到的矩阵稀疏性问题、冷启动问题和可扩展性差问题。
|
全文目录
摘要 5-6 Abstract 6-8 第一章 绪论 8-17 1.1 选题背景 8-9 1.2 研究和使用现状以及面临的问题 9-15 1.2.1 个性化推荐的研究现状 9-12 1.2.2 个性化推荐的使用现状 12-14 1.2.3 个性化推荐面临的问题 14-15 1.3 课题的研究内容和目标 15-16 1.3.1 课题的研究内容 15 1.3.2 课题的研究目标 15-16 1.4 论文组织结构 16-17 第二章 电子商务推荐系统及相关理论知识总述 17-26 2.1 数据挖掘技术概述 17-20 2.1.1 数据挖掘的定义 17-18 2.1.2 常用的数据挖掘技术 18 2.1.3 电子商务数据挖掘的对象 18-19 2.1.4 电子商务中使用数据挖掘的方法与好处 19-20 2.2 电子商务个性化推荐系统的概述 20-26 2.2.1 电子商务个性化推荐系统定义 20 2.2.2 电子商务个性化推荐系统的研究对象 20-21 2.2.3 电子商务个性化推荐系统的现实意义 21-22 2.2.4 电子商务个性化推荐系统的组成 22-24 2.2.5 电子商务个性化推荐系统面临的新挑战 24-26 第三章 个性化推荐算法的研究 26-38 3.1 基于内容的推荐算法 26-28 3.1.1 基于内容推荐的简单实例引入 26-27 3.1.2 基于内容推荐的流程分析 27-28 3.2 协同过滤推荐算法 28-36 3.2.1 基于用户的协同过滤算法 29-32 3.2.2 基于项目的协同过滤算法 32-35 3.2.3 目前存在的协同过滤改进方法 35-36 3.3 推荐算法的优劣比较 36-38 第四章 基于协同过滤算法的改进 38-47 4.1 RBFN和SOM的简述 38-42 4.1.1 径向基函数网络 39-41 4.1.2 自组织映射网络 41-42 4.2 改进算法的设计过程 42-45 4.2.1 稀疏评分矩阵复杂化 43-44 4.2.2 用户聚类 44-45 4.3 推荐模型的设计过程 45-47 4.3.1 推荐模型的详细设计流程 45-47 第五章 基于改进方案的实验及其结论 47-52 5.1 实验准备 47-48 5.1.1 实验的数据集 47 5.1.2 评估标准 47-48 5.2 实验及结果分析 48-52 5.2.1 激活函数的选择 48-49 5.2.2 推荐精度的比较 49-51 5.2.3 实验结果分析 51-52 第六章 课题的总结与展望 52-54 6.1 工作总结 52-53 6.2 工作展望 53-54 参考文献 54-56 致谢 56
|
相似论文
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 基于数据挖掘技术的保健品营销研究,F426.72
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
- 基于行业参数优化模型的投资项目决策支持系统,F283
- 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
- AMG公司业务流程再造研究,F270.7
- 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
- C2C网络店铺的信誉评价研究,F203;F224
- 南极国际食品交易中心物流园运营管理研究,F426.82
- 论《联合国国际货物销售合同公约》在适用范围上的新发展,D997.1
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 我国电子商务中消费者权益保护对策研究,D923.8
- 基于自然遗忘的个性化推荐算法研究,TP311.52
- 基于大众标注的个性化推荐系统研究,TP393.09
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|