学位论文 > 优秀研究生学位论文题录展示
基于用户行为挖掘的推荐算法改进及应用研究
作 者: 王娜娜
导 师: 陈立潮
学 校: 太原科技大学
专 业: 计算机应用技术
关键词: 数据挖掘 有向图 相似性距离 Prefixspan算法 点击量
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 79次
引 用: 0次
阅 读: 论文下载
内容摘要
现有的序列模式挖掘算法已经在大型的数据库中得到广泛的应用。然而,随着数据挖掘技术的发展和应用领域的不断细化,用户对挖掘出来的序列模式提出了更高的要求。因此,将用户的要求或者是兴趣转化成一种或多种约束,来限定挖掘的维数,提高挖掘的效率已经成为挖掘领域内的一个研究重点。本文针对上述问题,将研究的重点放在了基于约束的序列模式挖掘算法的研究上,这对研究超市中客户购买模式、网站访问页面的序列模式、电信告警序列模式和DNA模式等问题有重要的意义。本文对国内外现有的序列模式挖掘算法和基于约束的序列模式挖掘算法进行了深入的研究和分析。基于约束的序列模式挖掘是在序列模式挖掘的基础上考虑了一些其它的信息,例如在超市客户购买行为分析中考虑到客户的年龄、性别等信息,这样的模式融合了更多的信息,应用价值也更高。本文通过对序列模式挖掘方法的研究和探讨,分别在预处理的过程中和序列模式的挖掘过程中进行了改进。在数据预处理的过程中,提出先将序列模糊分类,再利用数学中的抽样方法缩小挖掘规模。对序列进行模糊分类的研究中,在原有的各种相似性测度方法的基础上,提出了一种基于有向图的时间序列相似性研究方法,将有向图的概念引入到序列模式挖掘的过程中来;在序列模式挖掘的过程中,从Prefixspan算法的序列模式挖掘思想出发,针对传统的序列模式算法的局限性,提出了一种基于时间属性和点击量的CTSP算法,对原有“支持度”概念进行了改进,引入了频繁度和时间属性的概念,并加入了时间间隔和点击量等要素,从而使挖掘得到的信息具有了实时性的特点,有利于决策者更加准确的利用这些信息。
|
全文目录
中文摘要 3-4 ABSTRACT 4-8 第一章 绪论 8-16 1.1 课题的研究背景 8-9 1.2 国内外研究现状 9-14 1.2.1 推荐系统的研究现状 9-12 1.2.2 序列模式挖掘的研究现状 12-14 1.3 课题研究的主要内容 14 1.4 论文的组织结构 14-16 第二章 关联分析 16-28 2.1 基本概念和挖掘过程 16-18 2.2 关联规则的发现算法 18-22 2.2.1 算法Apriori 18-19 2.2.2 算法Apriori的改进算法 19-21 2.2.3 基于FP-Tree树的FP-Growth算法 21-22 2.3 关联规则的扩展 22-25 2.3.1 多层次关联规则 22-23 2.3.2 多维关联规则 23 2.3.3 定量关联规则 23-24 2.3.4 加权关联规则 24 2.3.5 序列模式分析 24-25 2.4 关联规则的价值衡量 25-26 2.5 本章小结 26-28 第三章 基于序列模式的数据挖掘 28-44 3.1 基本定义和数据类型 28-31 3.1.1 基本概念 28-29 3.1.2 数据源的形式 29-31 3.2 序列模式的发现 31-32 3.3 基于序列模式的挖掘算法 32-39 3.3.1 类Apriori算法 33-34 3.3.2 GSP算法 34-35 3.3.3 PrefixSpan算法 35-39 3.4 基于有向图的序列模式相似性研究 39-43 3.4.1 序列模式相似度的提出 39-40 3.4.2 基于有向图的时间序列相似性研究 40-41 3.4.3 基于有向图的时间相似性计算应用 41-43 3.5 本章小结 43-44 第四章 基于时间间隔和点击量的CTSP算法 44-52 4.1 PrefixSpan 算法背景 44-45 4.2 CTSP算法基本概念 45 4.3 基于时间间隔和点击量的CTSP算法 45-48 4.3.1 CTSP 算法数据存储类型 45-46 4.3.2 属性权重的计算 46 4.3.3 CTSP算法描述 46-48 4.4 基于时间间隔和点击量的CTSP算法应用 48-49 4.5 实验验证及性能分析 49-51 4.6 本章小结 51-52 第五章 总结与展望 52-54 5.1 总结 52 5.2 展望 52-54 参考文献 54-58 致谢 58-59 攻读学位期间发表的学术论文目录 59-60 个人简介 60-61
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 工件排序问题的若干研究,O157.5
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|