学位论文 > 优秀研究生学位论文题录展示
基于矩阵的多特征链接预测方法研究
作 者: 郭宏伟
导 师: 郭景峰
学 校: 燕山大学
专 业: 计算机应用技术
关键词: 链接预测 拓扑特征 属性特征 时间特征 语义特征
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 42次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘是一种将原有的数据分析法与处理大规模数据的复杂算法相结合的技术。链接挖掘作为数据挖掘的一个分支,它的研究任务包括描述和预测模型,随着链接概念的提出,链接预测已经成为近年来的研究热点。目前,现有的链接预测方法一方面仅利用一种特征(结构或属性特征)进行链接预测,忽视了时间因素和特征的重要性;另一方面,不能针对给定的合著网络系统地抽取拓扑特征和语义特征,预测能力比较低。本文针对这些问题展开了研究。首先,为兼顾社会网络所提供的属性信息、结构信息及网络的动态特性,本文采用矩阵法对网络的各种信息进行分析,并给出社会网络及其信息的表示形式。其次,提出一个以矩阵的方式来组合时间特征、加权属性特征和加权拓扑特征的链接预测方法。该方法利用社会网络中的一种对齐关系来识别出重要的特征,并以矩阵的方式将这些特征有效地组合起来,从而提高链接预测的性能。另外,采用奇异值分解技术来减小存储空间。再次,针对合著关系网络,首先给出合著网络中链接预测问题的定义,接着为捕获网络中多方面的有效信息,从给定网络中系统地、有步骤地提取拓扑特征、语义特征以及时间特征,再利用有监督学习框架组合这三种特征,并提出一个同时使用三种特征的链接预测模型,从而进一步提高链接预测的预测性能。最后,通过实验对所提出算法的可行性和有效性进行验证,实现了预期的研究目标。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-16 1.1 课题的研究背景和应用前景 10-11 1.2 国内外研究现状 11-14 1.3 本文研究的内容 14-15 1.4 本文的组织结构 15-16 第2章 基础知识和基本概念 16-28 2.1 社会网络简介 16-17 2.1.1 社会网络的概念 16-17 2.1.2 社会网络的特征 17 2.2 社会网络分析 17-19 2.3 链接挖掘的数据表示及特点 19-20 2.3.1 链接挖掘的数据表示 19-20 2.3.2 链接挖掘的数据特点 20 2.4 典型的链接挖掘任务 20-23 2.5 链接预测的方法 23-27 2.5.1 基于邻近程度度量的链接预测 24-25 2.5.2 基于有监督学习的链接预测 25-26 2.5.3 基于概率模型的链接预测 26-27 2.5.4 基于最大似然估计的链接预测 27 2.6 本章小结 27-28 第3章 合并加权特征的链接预测算法 28-40 3.1 引言 28 3.2 基本概念 28-30 3.3 合并加权特征的链接预测方法 30-36 3.3.1 获取特征的权值 31-33 3.3.2 基于矩阵方式组合特征 33-35 3.3.3 奇异值分解技术 35-36 3.4 合并加权特征的链接预测算法 36-38 3.5 算法的可行性和有效性分析 38-39 3.5.1 算法的可行性分析 38 3.5.2 算法的有效性分析 38-39 3.6 本章小结 39-40 第4章 针对合著网络的多特征链接预测算法 40-56 4.1 引言 40 4.2 相关工作及定义 40-42 4.3 合著网络中链接预测问题的定义 42-43 4.4 针对合著网络的特征提取 43-52 4.4.1 提取拓扑特征 43-49 4.4.2 提取语义特征 49-50 4.4.3 提取时间特征 50-52 4.5 利用有监督学习框架组合特征 52-54 4.5.1 为有监督学习准备数据集 52-54 4.5.2 应用已有的分类算法构造链接预测模型 54 4.6 算法分析 54-55 4.7 本章小结 55-56 第5章 算法的实验验证 56-66 5.1 引言 56 5.2 合并加权特征链接预测算法的实验与分析 56-62 5.2.1 实验数据设置 56-57 5.2.2 实验环境设置 57-58 5.2.3 实验验证过程 58-59 5.2.4 实验结果分析 59-62 5.3 针对合著网络的多特征链接预测算法实验与分析 62-65 5.3.1 实验数据设置 62 5.3.2 实验环境设置 62-63 5.3.3 实验结果分析 63-65 5.4 本章小结 65-66 结论 66-68 参考文献 68-74 攻读硕士学位期间承担的科研任务与主要成果 74-75 致谢 75-76 作者简介 76
|
相似论文
- 中文产品评论观点抽取方法研究,TP391.1
- 尿石症流行病学及体外冲击波碎石术的影响因素研究,R699
- 基于链接重要性的动态链接预测算法研究,TP393.03
- “NP1+V+有+NP2”类存在句研究,H146
- 动趋式“V+开去”的句法语义研究,H146
- 现代汉语“V+N”结构关系研究说略,H146
- 太原方言副词研究,H172.2
- 基于时空特征的福建省滨海地区旅游客源市场研究,F224
- 概念格的属性约简研究,TP18
- 互联网人物信息排歧技术研究,TP393.4
- 马尔可夫逻辑网在超文本分类与链接预测中的应用,O211.62
- 优秀男女乒乓球运动员单打和双打比赛的时间和板数特征分析,G846
- 基于MRG骨架树的三维模型检索方法,TP391.41
- “不说”递进复句的研究,H146.3
- 现代汉语叙实词语研究,H146
- 互联网自治系统级拓扑特征分析与建模,TP393.02
- 时间词“刚”、“刚刚”和“刚才”的比较研究,H146
- 渭北旱塬地区气候变化的时空特征及突变性分析,P467
- 现代汉语“管”字句研究,H146
- 第19届世界杯足球赛得分手段的时空特征分析,G843
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|