学位论文 > 优秀研究生学位论文题录展示

基于Web日志的用户挖掘研究与实现

作 者: 凌晓琴
导 师: 宋斌
学 校: 南京理工大学
专 业: 计算机应用
关键词: 用户行为分析 蚁群算法 Web日志 离差最大化赋权算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 68次
引 用: 0次
阅 读: 论文下载
 

内容摘要


由于Web的全球普及,Web上信息量无比丰富。不同种类的用户群体从Web页面中提取的信息肯定大不相同。通过对Web日志的挖掘,结合聚类技术有效地对用户行为进行聚类,可以优化网站、为用户提供个性化服务、便于网络营销、改善网络安全等等。因此,利用Web日志挖掘用户的行为已成为当今热门的研究话题。本文提出了一种基于Web日志对用户行为的挖掘方法,主要通过对Web日志进行数据预处理、用户识别、事务识别等步骤,得到用户的事务列表,从事务列表中提取了用户访问页面的时间、感兴趣的页面数、下载次数等特征值,利用改进的蚂蚁堆聚类算法对用户行为进行聚类分析。在基于蚂蚁堆行为的算法中,本文改进了传统的LF算法,主要体现在用户行为相似性计算中。针对传统的特征加权算法通常采用平均值的处理,不能满足本文用户行为聚类分析,本文采用离差最大化赋权方法,对各维特征值的权系数进行改进。与传统的蚂蚁堆聚类算法相比,本文提出的方法更适合高维特征值的聚类,更好地反映了用户的行为规律,从而为网管人员有针对性的优化网络,满足客户对应用的需求。

全文目录


摘要  3-4
Abstract  4-7
1 绪论  7-11
  1.1 课题目的和意义  7-8
  1.2 国内外研究现状  8
  1.3 本文研究内容  8-9
  1.4 本文组织结构  9-11
2 基于Web日志用户挖掘的相关概念和技术  11-25
  2.1 网络信息的数据挖掘  11-13
    2.1.1 Web挖掘定义  11-12
    2.1.2 Web挖掘分类  12-13
  2.2 Web使用挖掘  13-17
    2.2.1 数据预处理  14-16
    2.2.2 模式发现  16-17
  2.3 网络用户及网络用户行为  17-20
    2.3.1 网络用户  17-18
    2.3.2 网络用户行为  18-20
  2.4 网络用户行为的表示和分析方法  20-23
    2.4.1 网络用户行为的表示  20-21
    2.4.2 网络用户行为的分析方法  21-23
  2.5 用户行为分析的应用  23-25
3 基于Web日志用户行为挖掘的总体设计与实现  25-48
  3.1 网络用户行为分析系统的总体设计  25-28
    3.1.1 数据预处理  26-27
    3.1.2 路径补全  27
    3.1.3 用户行为特征属性的提取  27-28
    3.1.4 网络用户行为挖掘模式  28
  3.2 基于Web日志用户行为分析系统的实现  28-48
    3.2.1 数据的收集  28-30
    3.2.2 Web日志预处理  30-37
    3.2.3 提取用户感兴趣的页面  37-38
    3.2.4 网络用户行为的提取和表示  38-41
    3.2.5 网络用户行为分析  41-48
4 网络用户行为分析系统的应用效果分析  48-53
  4.1 系统在"天空教室"的应用  48-51
  4.2 应用结果分析  51-53
5 结论与展望  53-55
致谢  55-56
参考文献  56-58

相似论文

  1. 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
  2. 基于蚁群算法的电梯群优化控制研究,TU857
  3. 动态环境下移动对象导航系统相关技术的研究,TP301.6
  4. 基于改进蚁群算法的机器人路径规划研究,TP242
  5. 改进的蚁群算法及其在TSP上的应用研究,TP301.6
  6. 基于免疫机制蚁群算法的电力系统无功优化研究,TP18
  7. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  8. 基于兴趣度的Web日志用户访问序列模式挖掘,TP311.13
  9. 基于改进蚁群算法的移动机器人路径规划问题研究,TP242
  10. 基于协同理论的零售商贸物流发展模式研究,F721
  11. 基于ACO的自组网QoS组播路由算法研究,TN929.5
  12. 蚁群算法与A*算法在Ad-Hoc网络中的应用研究,TN929.5
  13. 融合蚁群算法和遗传算法的陆航飞行保障管理信息系统,TP311.52
  14. 基于改进蚁群算法的物流配送路径研究,TP301.6
  15. 基于物理拓扑感知的Chord算法研究,TP393.02
  16. 电渣炉过程控制系统的设计及优化控制,TP273
  17. 基于蚁群优化的Ad Hoc网络能量感知路由算法,TN929.5
  18. 蚁群算法在QoS网络路由优化中的应用,TP393.09
  19. 遂宁市政府个性化门户网站系统的设计与实现,TP311.52
  20. 基于GIS技术的城市数字管网系统的研究与应用,P208

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com