学位论文 > 优秀研究生学位论文题录展示

短信种子用户识别的研究

作 者: 李兵昌
导 师: 张平健; 潘勇
学 校: 华南理工大学
专 业: 软件工程
关键词: 种子用户 数据挖掘 密度聚类 MapReduce
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 13次
引 用: 0次
阅 读: 论文下载
 

内容摘要


目前随着社会的发展,科技的进步,手机用户的数量在疯狂的增长。随着移动通信、互联网业务的迅速发展,手机已经从生活奢侈品变成了生活日用品,是人们日常生活中不可缺少的一部分。人们随时随地使用手机打电话、发短信、上网,而用户的这些行为以及其个人基本信息均在运营商中有所记录,由此带来了短信的收发也呈现爆炸式的增长。随着手机的普及,使用手机的用户越来越多,手机用户使用手机的主要一个功能是用来发送和接收短信,每天都有数量非常庞大的短信产生,在这些数量庞大的短信中,有一部分是原创的短信,有一部分是转发的,这些短信之间看起来没有什么联系,其实不然,在这些数量庞大短信中隐藏着种子短信。种子短信就是由种子用户发出来的,然后在大量手机用户之间形成大量转发的短信。如何从这些短信的信息中挖掘出对公司有用有商业价值的信息是一个热门研究的课题。如何在这么多的短信中,挖掘出种子用户是本文研究重点。

全文目录


摘要  5-6
Abstract  6-9
第一章 绪论  9-12
  1.1 研究背景和意义  9-10
  1.2 课题研究现状  10-11
  1.3 本文的主要研究工作  11
  1.4 论文的组织结构安排  11-12
第二章 理论知识  12-21
  2.1 数据挖掘  12-16
    2.1.1 数据挖掘概念  12-13
    2.1.2 分类方法  13-15
    2.1.3 聚类方法  15-16
  2.2 PageRank 算法  16-20
  2.3 本章小结  20-21
第三章 种子用户模型的建立  21-38
  3.1 相关名词的定义  21
  3.2 短信转发模型  21-24
    3.2.1 模型的假设  21
    3.2.2 节点的定义  21-23
    3.2.3 模型的定义  23-24
  3.3 评分模型  24-28
    3.3.1 牛顿冷却定律  24-25
    3.3.2 衰减间隔的选择  25-26
    3.3.3 衰减间隔的比较  26-28
  3.4 节点的识别  28-33
  3.5 转发模型的建立  33-36
  3.6 本章小结  36-38
第四章 实验结果与分析  38-54
  4.1 关于 Hadoop  38
  4.2 MapReduce 模型介绍  38-43
  4.3 利用 MapReduce 模型处理数据  43-45
    4.3.1 数据准备  43
    4.3.2 实验数据的预处理  43-44
    4.3.3 节点的 MapReduce 处理过程  44-45
  4.4 实验平台  45-46
  4.5 实验结果  46-53
  4.6 本章小结  53-54
结论与展望  54-56
  研究工作总结  54
  研究工作展望  54-56
参考文献  56-59
攻读硕士学位期间取得的研究成果  59-60
致谢  60-61
附件  61

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  10. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  11. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  12. 基于行业参数优化模型的投资项目决策支持系统,F283
  13. 数据集市在电信经营分析中的应用研究,TP311.13
  14. 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
  15. 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
  16. 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
  17. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  18. 教学质量评估数据挖掘系统设计与开发,TP311.13
  19. 关联规则挖掘在交通事故成因分析中的应用,U491.31
  20. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  21. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com