学位论文 > 优秀研究生学位论文题录展示

蚁群聚类算法及其在电信客户分群中的应用

作 者: 邹远强
导 师: 李国徽;陈杰
学 校: 湖南大学
专 业: 软件工程
关键词: 数据挖掘 聚类 蚁群聚类 BIRCH 密度聚类 客户细分
分类号: TP18
类 型: 硕士论文
年 份: 2007年
下 载: 378次
引 用: 4次
阅 读: 论文下载
 

内容摘要


面对经济全球化和和全球经济信息化的发展趋势,提高信息技术在社会经济诸领域的应用水平是最终推动经济和社会的发展的必由之路。自八十年代以来,人工智能转入实际应用,并提出了一个新兴的、面向商业应用的研究课题――数据挖掘。数据挖掘技术在国外早己被应用于零售业的销售预测和分析、金融业的客户信用分析及客户欺诈分析、电信业的客户价值分析和销售预测等方面。面临日益激烈和复杂的竞争环境,国内企业也逐渐加快了信息化的步伐,在电信行业,各大电信运营商已经建立或正在建设以数据仓库技术为基础,以联机分析处理和数据挖掘工具为手段的企业经营分析系统,用以通过对业务运营系统日常积累的大量历史数据进行智能化分析,揭示企业运作和市场情况,从而帮助管理层做出正确明智的经营决策,进而提高企业的市场竞争力。论文对数据挖掘的基本方法之一聚类技术进行了较全面的比较研究,并利用改进的聚类算法来细分电信业客户,从而达到可识别具有相似特征的客户群,成为分析客户和形成市场策略的基础,真正做到在恰当的时间,通过恰当的渠道,为恰当的客户提供恰当的服务,以满足其需要和愿望。本文首先着重阐述了群体智能领域蚁群算法在聚类分析中的应用,分析了目前在此基础上有代表性的改进算法,并通过对比不同蚂蚁行为模型,验证了基于蚂蚁运动模型的一种自适应的蚁群聚类算法(Adaptive Ant Clustering,简称AAC)在聚类速度和质量等方面性能优越。针对现有的绝大多数聚类算法在低维、少量数据上表现较好,但在处理高维数据时聚类质量下降的缺陷,为满足电信行业的数据量大、维度高的特点,受自适应蚁群聚类算法(AAC)研究工作的启发,采用蚂蚁运动模型,提出了一种组合并行多蚁群聚类算法,该算法融入了层次和密度聚类的思想,称为混合蚁群聚类算法(Hybrid Ant Clustering,简称HAC)。该算法采用的是将海量数据分区进行并行聚类,最终合并的设计思路。通过实验证明,该改进算法在一定程度上提高聚类速度和质量。本文最后将此混合聚类算法成功应用于电信业客户细分。通过对用户资料、通话行为、服务行为等相关的属性进行数据挖掘,分析了各用户群的通话行为特征与服务类型特征以及各用户群与收益之间的关系,实验结果证实了该聚类算法的有效性。

全文目录


摘要  8-9
Abstract  9-13
第1章 绪论  13-20
  1.1 研究背景及意义  13-14
  1.2 相关研究现状  14-17
    1.2.1 数据挖掘及其发展现状和趋势  14-16
    1.2.2 群体智能的研究现状  16-17
  1.3 研究内容及创新点  17-19
  1.4 论文的组织结构  19-20
第2章 聚类分析技术  20-32
  2.1 聚类问题描述  20
  2.2 聚类分析的数据类型  20-21
  2.3 模式相似性测量  21-23
  2.4 聚类分析的评价标准  23-25
    2.4.1 聚类分析的度量标准  23-24
    2.4.2 评价函数  24-25
  2.5 聚类分析方法分类  25-30
    2.5.1 串行聚类算法  25-27
    2.5.2 并行聚类算法  27-28
    2.5.3 混合聚类算法  28-30
  2.6 目前聚类算法存在的一些问题  30-31
  2.7 本章小结  31-32
第3章 蚁群聚类算法  32-54
  3.1 蚁群聚类算法的发展  32
  3.2 标准蚁群聚类模型分析  32-35
    3.2.1 基本蚁群聚类模型  32-33
    3.2.2 LF 算法  33-35
  3.3 基于标准蚁群聚类算法的改进  35-36
  3.4 蚂蚁运动模型  36-40
    3.4.1 基本蚁群聚类模型与蚂蚁运动模型的比较  36-38
    3.4.2 基于蚂蚁运动模型的聚类算法  38-40
  3.5 结合层次及密度聚类思想的聚类新方法  40-53
    3.5.1 算法改进的思路  40
    3.5.2 HAC 算法的研究与实现  40-53
  3.6 本章小结  53-54
第4章 蚁群聚类算法在电信客户分群中的应用  54-65
  4.1 数据准备  55-61
    4.1.1 电信客户特征数据模型  55-56
    4.1.2 需求分析  56-59
    4.1.3 数据预处理  59-61
  4.2 客户细分及结果分析  61-64
    4.2.1 利用HAC 算法进行聚类分析  61-63
    4.2.2 聚类结果分析  63-64
  4.3 小结  64-65
结论与展望  65-67
参考文献  67-73
致谢  73-74
附录 A(攻读学位期间所发表的学术论文目录)  74

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 图像分割中阴影去除算法的研究,TP391.41
  3. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  4. 高血压前期证候特征研究,R259
  5. 基于数据挖掘技术的保健品营销研究,F426.72
  6. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  7. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  8. 大学生综合素质测评研究,G645.5
  9. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  10. 21个荷花品种遗传多样性的ISSR分析,S682.32
  11. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  12. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  13. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  14. 土壤环境功能区划研究,X321
  15. 大豆杂种优势及其遗传基础研究,S565.1
  16. Bicluster数据分析软件设计与实现,TP311.52
  17. 蚁群算法及其在气象卫星云图分割中的应用,TP391.41
  18. 基于变异粒子群的聚类算法研究,TP18
  19. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  20. 基于数据挖掘的税务稽查选案研究,F812.42
  21. 基于运动目标轨迹分析的智能交通监控系统,TP277

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com