学位论文 > 优秀研究生学位论文题录展示
多关系社会网络分析和可视化系统的研究
作 者: 索利军
导 师: 吴斌
学 校: 北京邮电大学
专 业: 计算机科学与技术
关键词: 多关系社会网络 实体解析 社群发现 可视分析
分类号: O157.5
类 型: 硕士论文
年 份: 2010年
下 载: 292次
引 用: 1次
阅 读: 论文下载
内容摘要
传统的数据挖掘技术(包括分类,聚类,关联分析等)专注分析维表的属性,却忽略了记录之间所存在的关系。另一方面,现在主要的网络分析方法主要关注网络的拓扑结构分析而没有注意到网络中节点本身所具有的属性。本文提出的多关系社会网络旨在通过构建异构的网络模型来最大限度的保留原始数据的各种信息,并对多关系网络进行进一步的研究。本文主要对多关系社会网络做以下几方面的探讨:(1)多关系网络建模和网络提取。在对现实数据进行多关系网络建模之后,定义单一网络的抽取操作,从多关系网络中抽取特定意义的单一关系网络。(2)多关系社会网络的实体解析。从多个数据源中收集到的数据,只有经过集成和预处理才能被精确的知识发现模型所使用。而在多个数据源的数据进行集成合并到同一个数据集合当中时,会产生很多的重复记录。而这些数据并不是语义上唯一的,通常表示的是同一个实体。正确的合并这些重复的数据是制造高质量数据的至为重要的一部。这个过程被称之为实体解析(entity resolution),本文尝试在使用属性匹配的基础上,通过使用多关系社会网络多关系的特点,提升实体解析的准确率。(3)社团划分一直是研究复杂网络的一个重要手段,而目前的社团划分算法主要是使用网络拓扑的信息进行划分。本文的另一个研究点是研究在网络节点有属性的情况下,对网络进行社团划分。在使用网络拓扑的基础上,通过使用节点属性,进一步提高社团划分的准确率。(4)可视化,即通过提供统计或交互式视觉表现的软件系统来帮助人们探索和解释数据,是数据挖掘过程中极为重要的一个环节。本文也对多关系社会网络的可视化进行了研究,针对不同的网络类型设计不同的网络视图方案,并提出“网络浏览”的概念,将“网络浏览”应用到一个大规模网络浏览的框架下。(5)本文将上述的研究应用于国家科技支撑计划项目《科技文献信息服务系统关键技术研究及应用示范》,开发了一个科技信息可视分析系统(LiterMiner),通过工具证明了上述研究的可行性。
|
全文目录
摘要 4-6 Abstract 6-10 第一章 绪论 10-14 1.1 研究背景 10-11 1.2 研究内容 11-13 1.2.1 多关系网络的建模 12 1.2.2 基于多关系社会网络的实体解析 12 1.2.3 多关系社会网络的社团发现 12 1.2.4 多关系社会网络的可视分析 12-13 1.2.5 多关系社会网络的应用示范 13 1.3 论文组织结构 13-14 第二章 相关概念和工作 14-23 2.1 网络分析方法 14-15 2.1.1 基本概念 14 2.1.2 度数和度分布 14-15 2.1.3 介数 15 2.1.4 平均距离 15 2.1.5 簇系数 15 2.2 实体解析 15-16 2.3 社群发现 16-18 2.4 可视分析 18-20 2.5 网络分析工具 20-22 2.6 小结 22-23 第三章 多关系网络构建与实体解析 23-46 3.1 多关系社会网络建模 23-29 3.2 关系网络抽取 29-31 3.3 实体解析 31-45 3.3.1 概述 31-32 3.3.2 多关系网络的实体解析 32-45 3.4 小结 45-46 第四章 多关系网络的分析 46-65 4.1 多关系社群发现 46-53 4.1.1 概述 46-47 4.1.3 CDAN算法 47-51 4.1.4 实验分析 51-53 4.2 可视分析 53-55 4.2.1 可视化概述 53-54 4.2.2 网络视图工具介绍 54-55 4.3 多关系社会网络的可视分析 55-59 4.3.1 多关系社会网络的网络展示 55-58 4.3.2 多关系社会网络可视分析操作 58-59 4.4 大规模的网络的可视分析方案 59-64 4.4.1 系统架构 59-62 4.4.2 消息传递 62-64 4.5 小结 64-65 第五章 LiterMiner基于多关系社会网络的应用 65-79 5.1 项目背景和目标概述 65-66 5.2 工具的设计 66-67 5.3 工具的实现 67-73 5.3.1 系统总包图 68-69 5.3.2 多关系数据建模的实现 69-71 5.3.3 实体解析过程的实现 71-72 5.3.4 协同分析的实现 72-73 5.4 工具的应用场景 73-78 5.4.1 数据导入 73-74 5.4.2 数据清理 74-76 5.4.3 协同分析 76-78 5.4.4 报表生成 78 5.5 小结 78-79 第六章 结束语 79-81 6.1 本文总结 79 6.2 展望 79-81 参考文献 81-85 致谢 85-86 攻读硕士学位期间发表的论文 86
|
相似论文
- 面向寿险领域的数据挖掘研究及其应用,TP311.13
- 基于RIA的科技文献分析与可视化系统的研究与实现,TP391.41
- 基于GraphOLAP的文献分析与可视化系统的研究与实现,TP391.1
- 基于Flex的信息可视化框架研究与实现,TP391.41
- 森林防火辅助指挥系统的研究与实现,TP311.52
- 移动式森林防火指挥系统的实现研究,TP311.52
- 真实战场环境中GIS空间分析研究,P208
- 基于复杂网络的可视化方法研究及其应用,TN915.09
- 空间可视分析的关键技术和应用研究,P208
- 复杂布尔网络稳定性问题的研究,O157.5
- 复杂网络的建模分析及其应用,O157.5
- 关于特征多项式的两个参数及其应用,O157.5
- 工件排序问题的若干研究,O157.5
- 多属性无向加权图上的聚类方法研究,O157.5
- 复合型均衡网络的存在性及其算法研究,O157.5
- 随机网络模型分离,O157.5
- 两类图的色等价图,O157.5
- 图谱研究的一般方法,O157.5
- 基于复杂网络的供应链建模与网络效率研究,O157.5
- 复杂网络可靠性评价指标研究,O157.5
- M(?)bius cubes图的交叉数,O157.5
中图分类: > 数理科学和化学 > 数学 > 代数、数论、组合理论 > 组合数学(组合学) > 图论
© 2012 www.xueweilunwen.com
|