学位论文 > 优秀研究生学位论文题录展示

用户兴趣模型建模方法研究

作 者: 张琰渝
导 师: 任永功
学 校: 辽宁师范大学
专 业: 计算机软件与理论
关键词: Web数据挖掘 用户兴趣模型 事务间关联规则 最大频繁项目集 马尔可夫模型
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 117次
引 用: 1次
阅 读: 论文下载
 

内容摘要


数据挖掘(Data Mining)是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解模式的非平凡过程。其应用于网络环境中则称为Web数据挖掘(Web Data Mining)。Web数据挖掘是从Web中相关资源和用户浏览行为中抽取感兴趣的、有用的模式和隐含的信息。Web使用挖掘是Web数据挖掘的一种,挖掘的对象是用户在Web服务器上的信息,通过用户兴趣建模算法建立用户兴趣模型,挖掘用户兴趣,为用户提供更好的浏览体验。在众多的建模方法中关联规则和马尔可夫模型是两种非常重要的建模方法。本文对关联规则以及马尔可夫模型的相关算法进行系统的分析和总结,然后再此基础之上提出了新的建模方法:首先,提出了基于最大频繁项目集事务间关联规则的挖掘算法,由改进的Mafia算法,得到最大频繁项目集的同时得到对应的共有用户集,对事务内到事务间最大频繁项目集的转换,分析不同用户之间的关系及用户对网站上不同网页的访问情况,直接发现不同用户之间的关联关系来预测用户的兴趣。该方法经实验证明能够更加全面的预测用户感兴趣的网页,更好的为用户提供个性化服务。其次,在基于最大频繁项目集的挖掘事务间关联规则的算法的基础之上,结合两种建立用户数据库的方法,提出基于二阶马尔可夫模型与事务间关联规则的用户兴趣预测模型。另外,本文以用户指向思想为核心,通过分析用户之间的关系从而映射到有相同兴趣用户所对应的数据上,使找到的结果相对之前数据指向的结果更加符合用户的需求。改进的Mafia算法,使得这种最大频繁项目集的算法能够记录找到的最大频繁项目集中的项目在原数据中事务号的交集,从而方便使这种算法作用于事务间关联规则成为可能。加入马尔可夫模型,将事务间关联规则与2阶马尔可夫模型的结合起来,使事务间关联规则的挖掘结果准确性大幅度提高。在实际问题中,不同数据之间存在着一定的联系,关联规则就是用来找到这些联系的方法。但是随着数据量的增多,数据冗余和结果准确度之间的矛盾凸显,所以采用事务间关联规则来完善结果的准确性,同时加入马尔可夫模型的方法来解决数据冗余的问题,通过实验证这种结果是有效的。

全文目录


摘要  3-4
Abstract  4-8
1 绪论  8-11
  1.1 研究背景与意义  8
  1.2 国内外研究现状  8-9
  1.3 现有算法存在的问题  9
  1.4 主要工作及论文组织  9-11
2 关联规则及马尔可夫模型的相关知识  11-16
  2.1 关联规则的基本概念  11-12
    2.1.1 关联规则综述  11
    2.1.2 传统关联规则  11
    2.1.3 事务间关联规则  11-12
  2.2 关联规则的算法  12-14
    2.2.1 传统关联规则算法  12-13
    2.2.2 事务间关联规则算法  13-14
  2.3 马尔可夫模型的基本概念  14
    2.3.1 马尔可夫模型综述  14
  2.4 马尔可夫模型的算法  14-15
  2.5 本章小结  15-16
3 一种基于最大频繁项目集的事务间关联规则挖掘方法  16-25
  3.1 相关知识  16-18
  3.2 基本思想  18
  3.3 基于最大频繁项目集的挖掘事务间关联规则方法[25]  18-23
    3.3.1 算法基本步骤  18-19
    3.3.2 算法描述  19-22
    3.3.3 算法应用  22-23
  3.4 实验与分析  23-24
  3.5 本章小结  24-25
4 双策略用户兴趣模型  25-38
  4.1 相关知识  25-26
  4.2 基本思想  26-28
  4.3 用户兴趣模型DUIM(Dual User Interest Model)  28-35
    4.3.1 建立双重策略用户数据库  28-29
    4.3.2 预测策略一:2 阶马尔可夫模型  29-30
    4.3.3 预测策略二:事务间关联规则  30-31
    4.3.4 算法应用  31-35
  4.4 实验与分析  35-37
  4.5 本章小结  37-38
结论  38-40
参考文献  40-43
攻读硕士期间撰写和发表的学术论文  43
攻读硕士学位期间参与的科研项目  43-44
致谢  44

相似论文

  1. 网络语音传输丢包的恢复技术,TN912.3
  2. 领域实体属性及事件抽取技术研究,TP391.1
  3. 隐式用户兴趣挖掘的研究与实现,TP311.13
  4. 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
  5. 基于HMM的社交网络连接关系研究,F49
  6. 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
  7. 基于数据挖掘技术的求职招聘系统设计与实现,TP311.13
  8. 基于运动目标轨迹识别的人机交互系统研究,TP391.41
  9. 汉语语音合成系统的改进与实现,TN912.33
  10. 基于Web数据挖掘的个性化搜索引擎研究,TP391.3
  11. 基于Agent元搜索引擎的个性化研究,TP391.3
  12. 基于半监督学习的时间序列分类研究与实现,TP181
  13. 隐马尔科夫模型演化下的隐组检测,O157.5
  14. 网络信息提取系统关键技术研究,TP393.09
  15. 基于三阶马尔科夫模型和最大流的模体识别算法,TP301.6
  16. 基于Web数据挖掘的智能推荐研究,TP391.3
  17. 基于彩色图像的人脸检测与识别技术研究,TP391.41
  18. 基于自适应的LVCSR系统半监督学习方法的研究,TN912.34
  19. 基于HMM的藏语语料库词性自动标注研究,H214
  20. 搜索引擎的研究与设计,TP391.3
  21. Contourlet域统计图像建模与分割算法的研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com