学位论文 > 优秀研究生学位论文题录展示

社区挖掘算法研究

作 者: 才华
导 师: 周春光
学 校: 吉林大学
专 业: 计算机应用技术
关键词: 社会网络分析 社区结构挖掘 分裂算法 凝聚算法 模块性 相关性
分类号: TP311.13
类 型: 硕士论文
年 份: 2008年
下 载: 508次
引 用: 3次
阅 读: 论文下载
 

内容摘要


数据挖掘也可以称为数据库中的知识发现,是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程。将数据挖掘的方法应用于社会网络分析是数据挖掘研究领域的一个新方向。与传统数据挖掘研究的对象不同,在社会网络分析中个体之间由于存在着相互的联系,故不满足独立的假设,个体之间这种相互的联系就是关系。从数据挖掘的观点来说,一个社会网络就是用图表示的一个异种的和多关系的数据集,图中的节点代表被研究的个体,边代表个体之间存在的某种关系。随着研究的深入,人们发现,大量的社会网络都存在一种特性-社区结构,社区结构是社会网络的常见特征,表现为社区内个体之间的连接相对紧密,而各个社区间的连接却相对稀疏,整个社会网络就是由具有以上特性的若干个社区组成。本文针对社会网络中的社区结构挖掘算法进行了深入的研究,提出了三个新算法:OCSMA、DCSMA、MCSMA。⒈OCSMA算法针对单一关系的、静态的社会网络,在充分理解模块性函数的基础上,基于凝聚方法和贪婪算法原理,对Newman快速算法进行改进,挖掘社会网络中彼此重叠的社区结构。⒉DCSMA算法针对动态的社会网络,提出了新的社区定义,并结合连通性和频繁性概念提出一种新的算法,挖掘时刻连通的个体集合作为社区,采用层状结构模型,根据重要性权重区分社区内个体,使得社区结构更加清晰。⒊MCSMA算法针对多关系的社会网络,基于相关性分析去除冗余关系,并结合用户查询信息抽取一种组合关系,根据这种组合关系挖掘网络中满足用户需求的社区结构。通过对OCSMA、DCSMA、MCSMA算法在所选择的模拟数据集和标准数据集上进行实验,并与传统经典算法的实验结果进行比对和分析,验证了本文提出的三个算法的有效性和正确性。

全文目录


提要  4-8
第一章 绪论  8-15
  1.1 数据挖掘概述  8-9
  1.2 社会网络与社区挖掘  9-11
  1.3 国内外研究现状  11-12
  1.4 研究背景与意义  12
  1.5 本文主要工作  12-13
  1.6 本文组织结构  13-15
第二章 经典社区挖掘算法概述  15-21
  2.1 摘要  15
  2.2 Girvan and Newman’s 算法  15-16
    2.2.1 分裂算法  15-16
    2.2.2 Girvan and Newman’s 算法  16
  2.3 Newman 快速算法  16-17
    2.3.1 凝聚算法  16-17
    2.3.2 Newman 算法  17
  2.4 Normalized Cut 算法  17-18
  2.5 Kernighan-Lin 算法  18
  2.6 CONGA 算法  18-19
  2.7 其他社区挖掘算法  19-20
  2.8 本章小结  20-21
第三章 重叠社区结构挖掘算法  21-27
  3.1 摘要  21
  3.2 引言  21-22
  3.3 相关知识  22-23
    3.3.1 角色度量标准  22
    3.3.2 边介数  22-23
    3.3.3 模块性标准  23
  3.4 OCSMA 算法详述  23-25
  3.5 本章小结  25-27
第四章 动态社区结构挖掘算法  27-35
  4.1 摘要  27
  4.2 引言  27-28
  4.3 相关知识  28-31
    4.3.1 频繁模式发现  28-29
    4.3.2 图连通和图同构  29
    4.3.3 新的社区结构定义  29-31
  4.4 DCSMA 算法详述  31-34
  4.5 本章小结  34-35
第五章 多关系社区结构挖掘算法  35-40
  5.1 摘要  35
  5.2 引言  35-36
  5.3 相关知识  36-37
    5.3.1 关系选择  36
    5.3.2 关系抽取  36-37
    5.3.3 关系抽取算法Regression-Based  37
  5.4 MCSMA 算法详述  37-38
  5.5 本章小结  38-40
第六章 实验结果及分析  40-55
  6.1 实验环境  40
  6.2 OCSMA 算法实验结果评估  40-47
    6.2.1 模拟数据集合  40-43
    6.2.2 经典数据集合“KARATE CLUB”  43-44
    6.2.3 经典数据集合“DOLPHINS”  44-45
    6.2.4 经典数据集合“COLLEGE FOOTBALL”  45
    6.2.5 红楼梦家族关系网络  45-47
  6.3 DCSMA 算法实验结果评估  47-49
    6.3.1 精度比对实验  47-48
    6.3.2 算法消耗时间实验  48-49
    6.3.3 算法效果实验  49
  6.4 MCSMA 算法实验结果评估  49-55
    6.4.1 经典数据集合“WINE”  49-52
    6.4.2 经典数据集合“IRIS”  52-55
第七章 总结与展望  55-57
  7.1 总结  55-56
  7.2 展望  56-57
参考文献  57-61
附录导师及作者简介  61-62
摘要  62-64
Abstract  64-67
致谢  67

相似论文

  1. 光纤陀螺温度漂移建模与补偿,V241.5
  2. 极化SAR图像超分辨算法的研究,TN957.52
  3. 个性化检索中相似用户群的获取与更新,TP391.3
  4. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  5. 紫花苜蓿根系生长与地上部生长的相关性分析,S541.9
  6. 肉牛养殖过程中重金属类危害性因素分析,S823
  7. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  8. 教育等级性与收入差距相关性研究,G520
  9. 大豆品种对北豆腐品质的影响及其品质评价方法的研究,TS214.2
  10. 亲子关系对青少年网瘾的影响剖析与游戏治疗策略设计,D669.5
  11. CUBS男子运动员特质自信心与投篮命中率相关研究,G841
  12. 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
  13. 非小细胞肺癌组织中金属硫蛋白及基质金属蛋白酶-2的表达及相关性研究,R734.2
  14. 不结球白菜抽薹性状生化特性和分子标记及遗传模型分析,S634.3
  15. 兖州矿区植物波谱变异与重金属胁迫特征研究,X173
  16. 湖北软麦制作酥性饼干品质特性的改良研究,TS213.22
  17. 乙型肝炎病毒相关性肾炎尿液蛋白质组学的研究分析,R692.3
  18. 基于社会网络分析法的大学生网络意见领袖研究,G206
  19. 慢性阻塞性肺疾病患者营养状况与病情严重程度的关系,R563.9
  20. 沪深股市相关性的实证研究,F224
  21. 两种中药的化学物质与质量标准研究,R284.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com