学位论文 > 优秀研究生学位论文题录展示
基于通话记录的社会关系网络挖掘
作 者: 敖文井
导 师: 张平健; 潘勇
学 校: 华南理工大学
专 业: 软件工程
关键词: 电信 数据挖掘 社团发现 社会关系网路
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 49次
引 用: 0次
阅 读: 论文下载
内容摘要
从19世纪末电话的发明到20世纪移动电话的产生和发展,再到21世纪移动互联网的兴起,电信作为一种通信技术在不断地改变着人们的生活方式,同时也累积了大量的数据。21世纪是一个大数据时代,传统意义上的价格调整,硬件设备升级已经越来越无法适应现代电信行业竞争的需求,所以众多电信企业将竞争领域转移到多年累积的用户和通话数据上。如何从现有的通话记录中挖掘出未知的规律和商业信息,已经成为了一个热门的课题。作为数据挖掘的课题之一,社团发现已经被广泛研究,很多学者在此领域提出了很多新的理论和方法,比如,Kernighan-Lin算法[1],谱平分法[2][3],GN算法[4]等。其中一些算法在实际网络中也表现出了不错的挖掘效果。但是由于算法在效率或者结构上的局限性,导致了算法无法在很多特定的领域获得很好的效果,大部分算法也旨在从准确性和效率之间寻找一种平衡。电信用户构成了一个庞大的社会网络,但这个网络是相对稀疏的,离散点对于传统社团划分算法的效果会带来较大的影响。本文以真实的电信数据为基础,在现有数据挖掘理论知识基础上提出了一种基于社会三角形的网络社团划分方法。先从网络中寻找有三角形关系的用户群体,然后以这些三角形群体为初始社团,根据节点间相似性不断进行社团的扩充,对于那些没有被归入任何社团的点则视作离散点。这样就有效排除了稀疏网络中离散点带来的影响。本文将算法应用到了电信数据中进行测试,并与传统算法效果进行了比较分析。最后分析了算法目前存在的问题,并提出了后期需要进一步研究和改进的方向。
|
全文目录
摘要 5-6 ABSTRACT 6-7 目录 7-9 表目录 9-10 第一章 绪论 10-14 1.1 项目背景和意义 10-11 1.2 国内外研究现状 11-13 1.3 本文的组织和结构 13-14 第二章 相关知识介绍 14-26 2.1 统计学 14-16 2.1.1 定义 14 2.1.2 数据类型 14-15 2.1.3 数据来源 15 2.1.4 数据质量 15-16 2.2 数据挖掘流程及应用 16-24 2.2.1 定义 16 2.2.2 数据挖掘基本流程 16-21 2.2.3 聚类算法综述 21-24 2.3 本章小结 24-26 第三章 基于三角形理论的社团发现算法 26-45 3.1 常用社团发现算法综述 26-31 3.2 基于三角形理论改进的社团发现算法 31-39 3.2.1 影响社团划分效果的三个因素 31-33 3.2.2 三角形理论与算法实现 33-39 3.3 实验设计与结果 39-44 3.3.1 实验数据集介绍 39-40 3.3.2 实验结果与分析 40-44 3.4 本章小结 44-45 第四章 三角形算法在电信网络划分中的应用 45-52 4.1 实验数据介绍与预处理 45-47 4.1.1 实验数据简介 45 4.1.2 数据预处理 45-47 4.2 聚类有效性评价 47-48 4.3 实验设计与结果 48-49 4.3.1 实验设计 48 4.3.2 实验结果 48-49 4.4 实验结果比较分析 49-50 4.5 本章小结 50-52 总结与展望 52-54 论文内容总结 52-53 下一步工作展望 53-54 参考文献 54-57 附录 57-61 攻读硕士学位期间取得的研究成果 61-62 致谢 62-63 附件 63
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于行业参数优化模型的投资项目决策支持系统,F283
- 数据集市在电信经营分析中的应用研究,TP311.13
- 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
- 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
- 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 我国电信资费监管机制研究,F626
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|