学位论文 > 优秀研究生学位论文题录展示

聚类融合算法及其在移动通信企业的应用

作 者: 罗浩
导 师: 廖志芳
学 校: 中南大学
专 业: 计算机应用技术
关键词: 数据挖掘 聚类融合 差异性度量 共享最近邻 客户细分
分类号: F626
类 型: 硕士论文
年 份: 2009年
下 载: 90次
引 用: 4次
阅 读: 论文下载
 

内容摘要


聚类,作为数据挖掘技术研究的热点之一,受到越来越多的关注。聚类的主要任务就是把数据集划分成有意义或有用的组。随着数据库技术的飞速发展,各行各业中的信息数据也急剧地增长,而且数据的类型也由单一的数值型、文本型逐渐转变成混合型,这就对聚类分析技术提出了新的要求。从已有的文献来看,能有效处理混合型数据的算法相对较少。基于这一现状,本文重点研究了面向混合型数据的聚类融合算法,同时对其在移动通信行业中的应用进行了探讨。本文对已有的算法进行了研究比较之后,提出了一种基于图的聚类融合算法——GCE算法。该算法选取能处理混合型数据的k-prototypes算法和CBL算法作为聚类成员进行融合,以图为基础,利用图中顶点和边的权值设置来确定数据点之间的联系,通过数据点之间共享最近邻数来确定融合函数。通过公共数据集上的实验,结果表明该算法不仅能很好地处理混合型属性数据,而且得到比单一算法更为优越的结果。此外,本文还分析了4种聚类成员差异性度量与融合准确度之间的关系,实验结果表明成员大小为15到20左右,待聚类数据集有均匀簇分布时,各种差异性度量与融合方法性能间的相关程度最高。本文最后将此聚类融合算法成功应用于移动通信企业客户细分。通过对用户资料、通话行为、服务行为等相关的属性进行数据挖掘,分析了各用户群的通话行为特征与服务类型特征以及各用户群与收益之间的关系,实验结果证实了该聚类算法的有效性。

全文目录


摘要  3-4
ABSTRACT  4-7
第一章 绪论  7-16
  1.1 数据挖掘研究综述  7-12
    1.1.1 数据挖掘的研究背景和方法论  7-10
    1.1.2 数据挖掘的应用和研究方向  10-12
  1.2 数据挖掘中的聚类分析  12-14
    1.2.1 聚类分析的意义及研究现状  12-13
    1.2.2 混合型数据聚类问题  13-14
  1.3 论文内容及结构安排  14-15
  1.4 小结  15-16
第二章 聚类分析与聚类融合  16-32
  2.1 聚类分析  16-22
    2.1.1 聚类的定义  16
    2.1.2 聚类分析中的数据结构和数据类型  16-20
    2.1.3 主要聚类方法的分类及对比  20-22
  2.2 聚类融合  22-30
    2.2.1 聚类融合研究概述  22-24
    2.2.2 聚类融合的研究内容和主要进展  24-28
    2.2.3 聚类融合中的差异性度量方法  28-30
  2.3 小结  30-32
第三章 基于图的聚类融合算法(GCE)  32-49
  3.1 算法思想  32-33
    3.1.1 现有聚类算法存在的问题  32-33
    3.1.2 算法改进思路  33
  3.2 聚类融合算法关键技术  33-39
    3.2.1 聚类成员的选取  33-35
    3.2.2 融合函数的设计  35-38
    3.2.3 簇有效性的监督度量  38-39
  3.3 算法描述  39-41
  3.4 算法复杂度分析  41
  3.5 实验结果分析及算法比较  41-46
    3.5.1 实验结果分析及比较  41-45
    3.5.2 与单一算法比较  45-46
  3.6 聚类融合差异性度量分析  46-48
  3.7 小结  48-49
第四章 聚类融合算法在移动通信行业中的应用  49-60
  4.1 背景  49-50
  4.2 客户细分  50-52
    4.2.1 移动通信企业中的客户细分  50-51
    4.2.2 现有客户细分方法及其问题  51-52
  4.3 聚类融合算法在通信行业中的应用实例  52-58
    4.3.1 移动通信客户细分模型  52-53
    4.3.2 需求分析  53-54
    4.3.3 数据准备  54-55
    4.3.4 GCE算法在移动通信中的应用  55-56
    4.3.5 结果呈现与评估  56-58
  4.4 小结  58-60
第五章 总结与展望  60-62
  5.1 工作总结  60
  5.2 研究展望  60-62
参考文献  62-67
致谢  67-68
攻读学位期间主要的研究成果  68

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  10. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  11. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  12. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  13. 教学质量评估数据挖掘系统设计与开发,TP311.13
  14. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  15. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  16. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  17. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  18. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  19. 高校毕业生就业状况监测系统研究,G647.38
  20. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  21. 基于数据挖掘的信用卡客户激活与响应度研究,F832.2

中图分类: > 经济 > 邮电经济 > 电信 > 电信企业组织和经营管理
© 2012 www.xueweilunwen.com