学位论文 > 优秀研究生学位论文题录展示

基于复杂网络理论的社区结构挖掘与人类行为模式特征分析

作 者: 陈传梓
导 师: 金小刚
学 校: 浙江大学
专 业: 计算机应用技术
关键词: 复杂网络 数据挖掘 出租车 博客 行为模式 社区结构 特征分析
分类号: O157.5
类 型: 硕士论文
年 份: 2011年
下 载: 380次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,复杂网络理论的发展为人类了解诸如Internet、生物网络、WWW、Blog网络等真实网络提供了理论模型和研究框架。研究表明,大量的真实网络具有小世界效应、无标度性质、聚集性质和社区结构特性。如何从大量真实网络的数据中发现有意义的基本特征信息以及通过对行为数据分析社区结构特性以及进行行为预测匹配是近年来复杂网络理论应用以及Web数据挖掘的研究热点问题之一。社区结构是复杂网络的一个重要特性,对社区结构的挖掘研究可以更好地揭示出复杂网络的内部结构,而复杂网络的内部结构进一步地影响到网络的演化和动力行为特征。到目前为止,对社会网络的主要研究大多基于静态网络或演化网络。在静态网络中,现实中的网络被建模为时间无关的网络,而在演化网络中,许多研究者只考虑随时间推移而增加的节点和边。通过这些研究,已经有许多显著的发现被应用于诸如互联网和引用网络中,例如小世界特性和无标度特性,然而当涉及到社会网络时,静态网络和演化网络是不足以描述这一情形的。而人类行为则是典型的社会动态网络,构建合理的网络规则,建立正确的网络模型是研究人类行为的一种有效手段。行为网络是一种特殊的社会网络,通过对行为网络中数据的特征分析和社区结构挖掘,有助于我们进一步对行为进行预测以及提出实际可以提高效率的解决方案,也是对真实社会网络建模和分析的依据和基础。论文将复杂网络的理论应用于上海市出租车运行模式和博客空间社区结构划分上,分别对来自上海市公交公司的出租车数据和博客数据进行了分析研究。论文的具体工作如下:1、对来源于上海市公交公司的数据进行处理,获得样本出租车运行的有效动态轨迹网络图,为理解复杂网络小世界效应、无标度性质、聚集性质和社区结构特性建立了新的视角;2、从复杂网络基本特征出发,分析出租车行为特征与人类活动基本特性的异同之处,包括活动轨迹图,步长概率分布图,行为模式随时间增长的回旋半径大小关系,活动的时空特性,各向异性等结论:出租车虽然和人类行为属于不同的活动模式,但是同样遵循复杂网络的基本特性,属于无标度网络范畴。该研究对构建动态的接触网络模型提供了依据,同时也会对上海市的功能区域预测匹配以及上海市出租车的资源配置和利益收入有一定的指导意义;3、通过博客空间的社区结构分析,对原博客空间的数据进行网络图描绘,并进行合理的社区结构划分与验证。应用了海量数据的处理方法,结合采用层次化社区划分和模块化方法对博客空间进行社区划分,得到原博客空间的7个社区结构,并计算出相应的模块化Q值,验证了博客空间的复杂网络基本特性。

全文目录


摘要  3-5
Abstract  5-12
第1章 绪论  12-16
  1.1 研究背景  12-13
  1.2 研究意义  13-14
  1.3 论文组织结构  14-15
  1.4 本章小结  15-16
第2章 复杂网络概述  16-24
  2.1 复杂网络的起源与发展  16-17
    2.1.1 复杂网络的起源  16-17
    2.1.2 复杂网络的发展  17
  2.2 复杂网络的基本概念  17-18
  2.3 复杂网络的特征  18-21
  2.4 复杂网络的进展  21-23
  2.5 本章小结  23-24
第3章 复杂网络中的社区结构定义及挖掘方法  24-38
  3.1 社区结构概述  24-25
  3.2 社区结构的量化定义  25-26
  3.3 社区结构挖掘  26-37
    3.3.1 社区结构挖掘思想  26-28
    3.3.2 群组层次分类  28-30
    3.3.3 似然估计法  30-33
    3.3.4 模块化算法  33-35
    3.3.5 扩展法  35-37
  3.4 本章小结  37-38
第4章 移动数据的网络图构建及特征分析  38-61
  4.1 问题描述  38-39
  4.2 网络图构建  39-48
    4.2.1 数据集描述  39-40
    4.2.2 数据集的处理  40-44
    4.2.3 数据集完备  44-47
    4.2.4 数据集的网络图构建  47-48
  4.3 常见生物行为特征分析  48-53
    4.3.1 Bank notes模型  48-49
    4.3.2 海洋捕食者行为特征分析  49-51
    4.3.3 人类活动行为分析  51-53
  4.4 出租车行为特征分析  53-59
    4.4.1 基本特征分析与比较  53-56
    4.4.2 时空特征分析与比较  56-57
    4.4.3 出租车的各向异性特征分析  57-59
  4.5 本章小结  59-61
第5章 博客空间的社区结构发现  61-73
  5.1 博客空间的网络图表示  61-63
  5.2 博客空间的社区结构挖掘  63-70
    5.2.1 博客空间数据描述  63-64
    5.2.2 博客空间社区结构划分  64-68
    5.2.3 博客空间社区结构划分的验证  68-70
  5.3 博客空间的特征分析  70-71
  5.4 本章小结  71-73
第6章 总结与展望  73-76
  6.1 本文工作总结  73
  6.2 未来工作展望  73-76
参考文献  76-79
攻读硕士学位期间主要的研究项目  79-80
致谢  80

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. 基于核方法的高光谱图像异常检测算法研究,TP751
  5. 基于行为模式的小区公共家具用户需求研究,F426.88
  6. 复杂网络的建模分析及其应用,O157.5
  7. 江苏省典型区域农村地表水环境现状空间分析及污染评价,S271
  8. Bicluster数据分析软件设计与实现,TP311.52
  9. 基于变异粒子群的聚类算法研究,TP18
  10. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  11. 基于遗传算法和粗糙集的聚类算法研究,TP18
  12. 萝卜耐热性鉴定与热激蛋白基因克隆,S631.1
  13. 博客应用于中职英语阅读教学的研究,G633.41
  14. 基于数据挖掘的税务稽查选案研究,F812.42
  15. 基于复杂网络特征的SNS社交网站传播特征研究,G206
  16. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  17. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  18. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  19. 博客发展现状及其盈利模式研究,F49
  20. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  21. 教学质量评估数据挖掘系统设计与开发,TP311.13

中图分类: > 数理科学和化学 > 数学 > 代数、数论、组合理论 > 组合数学(组合学) > 图论
© 2012 www.xueweilunwen.com