学位论文 > 优秀研究生学位论文题录展示

数据挖掘技术在骚扰电话监控系统的应用研究

作 者: 王丹阳
导 师: 范年柏;袁志刚
学 校: 湖南大学
专 业: 软件工程
关键词: 数据挖掘 骚扰电话 贝叶斯算法 K-means算法
分类号: TN916.2
类 型: 硕士论文
年 份: 2010年
下 载: 39次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息化的到来,各类数据急剧膨胀,面对海量的存储数据,如何从中发现有价值的信息或知识是一项非常艰巨的任务。数据挖掘就是为了满足这种要求而迅速发展起来的。数据挖掘是从大量的、不完全的、有噪声的、模糊的和随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘作为一门新兴的边缘学科,汇集了来自数据库技术、统计学、机器学习、高性能计算、模式识别、神经网络以及管理信息系统等各学科的研究成果。其发现的知识可以用于决策、过程控制、信息管理、查询处理等方面,具有重要的实践意义。国内外对于垃圾短信监控有比较多的结合数据挖掘技术的过滤、拦截方法,而对于骚扰电话系统的监控技术没有系统的理论。如何在海量数据中快速、准确地查出所有骚扰电话号码,减少误判,减少省客服人员回拨确认的工作量,是骚扰电话监控系统的重心。因此,本文首先分析了当前已有的骚扰电话监控系统的不足,提出了将数据挖掘技术引入监控系统的设想。其次,介绍了建立骚扰电话监控系统的相关技术:7号信令监测、数据挖掘技术等。最后,通过对贝叶斯算法K-means算法进行分析研究,提出针对实际工程项目,采用改进贝叶斯算法、指导性K-means算法等技术建模以及验证过程。对应用数据挖掘技术的骚扰电话监控系统性能测试表明:将改进的贝叶斯算法、指导性的K-means算法应用于实际的骚扰电话监控和拦截功能中。采用了数据挖掘的监控系统给通信企业带来了成本效益和社会效益:可比较准确性地智能辨别出骚扰电话号码,并智能化地对骚扰号码实施拦截,从而降低省客服人员处理骚扰电话的工作量,同时有效拦截骚扰电话,降低了移动用户对骚扰电话投诉量,提升了客户对网络质量的感知,为湖南移动构建了绿色的网络。

全文目录


摘要  5-6
Abstract  6-10
插图索引  10-11
附表索引  11-12
第1章 绪论  12-18
  1.1 课题研究的背景  12-13
  1.2 课题研究的目标  13
  1.3 课题研究的现状  13-16
    1.3.1 国外移动通信行业发展现状  13-14
    1.3.2 国内移动通信行业发展现状  14-16
  1.4 课题研究的发展趋势  16
  1.5 本文的创新点  16-17
    1.5.1 建立基于改进的贝叶斯算法骚扰电话智能化监控模型  16
    1.5.2 提出利用指定型K-means算法测算骚扰电话生命周期  16-17
  1.6 论文的主要内容  17-18
第2章 相关技术  18-39
  2.1 移动通信网相关知识简介  18-23
    2.1.1 移动通信网的概念  18-19
    2.1.2 GSM通信网介绍  19-23
  2.2 7号信令监测技术简介  23-31
    2.2.1 信令概述  23-24
    2.2.2 7号信令基本术语  24-26
    2.2.3 七号信令的协议体系结构  26-27
    2.2.4 电话用户部分(TUP)  27-28
    2.2.5 ISDN用户部分-ISUP  28-30
    2.2.6 湖南移动省内7号信令监测系统介绍  30-31
  2.3 数据挖掘技术概述  31-34
    2.3.1 数据挖掘的定义  31
    2.3.2 数据挖掘的过程  31-32
    2.3.3 数据挖掘技术简介  32-34
  2.4 骚扰电话监控系统工作原理  34-37
    2.4.1 骚扰电话监控、拦截流程  34-35
    2.4.2 骚扰电话监控系统架构  35-37
  2.5 监控系统一期介绍  37-38
  2.6 本章小结  38-39
第3章 基于改进贝叶斯算法的骚扰电话辨别  39-46
  3.1 贝叶斯概述  39
  3.2 贝叶斯定义及相关概念  39-40
  3.3 朴素贝叶斯算法介绍  40-41
  3.4 其他典型的分类算法简介  41-42
  3.5 改进的贝叶斯算法模型  42-43
  3.6 基于改进贝叶斯算法的骚扰电话疑似号码识别流程  43-45
    3.6.1 训练集数据收集  44
    3.6.2 条件概率矩阵生成  44-45
    3.6.3 未知样本识别  45
  3.7 本章小结  45-46
第4章 基于K-MEANS算法的骚扰电话生命周期测算  46-52
  4.1 生命周期的定义  46
  4.2 K-MEANS算法介绍  46-48
  4.3 指导性的K-MEANS算法  48-49
  4.4 基于K-MEANS算法的骚扰电话生命周期测算算法设计与实现  49-51
    4.4.1 输入数据收集  49
    4.4.2 输入数据的处理  49
    4.4.3 距离的计算  49-51
  4.5 本章小结  51-52
第5章 效果评估  52-57
  5.1 基于改进贝叶斯算法的骚扰电话辨别应用成果  52-54
    5.1.1 骚扰电话疑似号码监控流程  52-53
    5.1.2 基于改进贝叶斯算法的骚扰电话辨别率数据比对  53-54
    5.1.3 采用改进贝叶斯算法提高系统工作效率  54
  5.2 基于K-MEANS算法的骚扰电话生命周期测算应用成果  54-56
    5.2.1 骚扰电话黑名单拦截流程  54-55
    5.2.2 基于K-means算法的骚扰电话生命周期测算数据统计  55
    5.2.3 采用智能化拦截治理骚扰电话的效果  55-56
  5.3 本章小结  56-57
结论  57-59
参考文献  59-62
致谢  62-63
附录A 攻读学位期间所发表的学术论文目录  63-64
附录B 攻读学位期间参与的主要项目  64-65
附录C 论文中类图和主要函数  65-67

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. K-means聚类优化算法的研究,TP311.13
  7. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  8. 基于遗传算法和粗糙集的聚类算法研究,TP18
  9. 基于数据挖掘的税务稽查选案研究,F812.42
  10. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  11. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  12. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  13. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  14. 教学质量评估数据挖掘系统设计与开发,TP311.13
  15. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  16. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  17. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  18. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  19. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  20. 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
  21. 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电话 > 电话线路、电话网
© 2012 www.xueweilunwen.com