学位论文 > 优秀研究生学位论文题录展示

基于聚类算法的流量识别方法研究及系统实现

作 者: 苏欣
导 师: 张大方;谢高岗
学 校: 湖南大学
专 业: 软件工程
关键词: 流量识别 聚类算法 XML K-means算法
分类号: TP393.06
类 型: 硕士论文
年 份: 2008年
下 载: 130次
引 用: 1次
阅 读: 论文下载
 

内容摘要


准确而快速的识别流量是确保网络安全和流量控制的基础。尤其是在如今Internet技术飞速发展,不断涌现出新型的协议及应用软件,如P2P(Peer-To-Peer)等。新业务不断增加,使得出口网络带宽利用率居高不下,甚至引起网络拥塞,对于企业或者校园网络来说尤为明显。同时,通过不安全的网络环境获得的应用程序,可能使得病毒和恶意代码入侵。本文的主要工作如下:1.研究了应用在网络传输的各个属性,以及几种面向流量识别聚类算法,并分析了各个属性的优势和劣势,以及面向流量识别的聚类算法的优点和存在的缺陷,为本文的研究目标确定了方向。2.在流量识别算法设计环节,首先本文确定了以应用在进行网络连接时候的前4个数据包的长度和方向为流量识别指标;其次,以K-means算法为例,由于原始的K-means算法的初始化簇中心的选择存在缺陷,通过对这个环节的改进,并引入NMI值来对聚类效果进行验证,得到了一种改进的K-means算法,使用这个算法来对所选取的识别指标进行聚类和特征提取。3.在聚类算法提取出特征后,针对现今网络流量的特征变化较快,而修改程序中的特征参数带来编译时间较长,降低系统性能的问题。本文提出使用XML脚本语言来对流量特征进行描述,程序通过读取特征描述文件在线匹配流量。这种方法在遇到特征变化的时候,只需修改脚本文件里面的特征参数即可。4.基于上述3点,本文设计与实现了基于聚类算法的流量识别系统。该系统能支持多种聚类算法,并将所得到的流量特征使用XML脚本语言描述。通过加载特征描述文件来在线识别流量。

全文目录


摘要  5-6
ABSTRACT  6-13
第1章 绪论  13-20
  1.1 选题背景及意义  13-15
  1.2 国内外研究现状和已有成果  15-17
    1.2.1 基于端口识别方法  15-16
    1.2.2 基于负载识别方法  16-17
    1.2.3 基于测度识别方法  17
    1.2.4 综合方法  17
  1.3 论文的研究思路和主要工作  17-18
  1.4 论文的结构  18-20
第2章 面向流量识别聚类算法研究与分析  20-33
  2.1 数据挖掘技术介绍  20-23
  2.2 聚类技术介绍  23-25
  2.3 聚类算法  25-27
  2.4 K-MEANS 算法  27-30
    2.4.1 K-means 算法基本思想  27-28
    2.4.2 K-means 算法分析  28-30
  2.5 DBSCAN 算法  30-31
    2.5.1 DBSCAN 算法基本思想  30-31
    2.5.2 DBSCAN 算法分析  31
  2.6 K-MEDOIDS 算法  31-32
    2.6.1 K-medoids 算法基本思想  31
    2.6.2 K-medoids 算法分析  31-32
  2.7 已有的基于聚类分析的流量识别方法  32
  2.8 本章小结  32-33
第3章 基于K-MEANS++的流量识别算法设计  33-41
  3.1 识别测度的选择  33-37
    3.1.1 先前的研究  33
    3.1.2 合适的识别测度  33-37
  3.2 识别测度的提取  37
  3.3 训练数据集  37
  3.4 K-MEANS++算法聚类  37-40
    3.4.1 初始化簇中心的选择  37-38
    3.4.2 簇质量优化  38-40
  3.5 在线识别  40
  3.6 本章小结  40-41
第4章 基于XML 脚本语言的流量特征描述方法  41-46
  4.1 XML 介绍  41-42
  4.2 描述方法  42-44
    4.2.1 基本协议描述规则  42-43
    4.2.2 XML 文件解析方法  43-44
    4.2.3 匹配过程  44
  4.3 性能对比  44-45
  4.4 本章小结  45-46
第5章 基于聚类算法的流量识别系统实现和验证  46-61
  5.1 系统功能需求  46
  5.2 系统运行的软硬件环境  46
  5.3 基于聚类算法的流量识别系统设计实现  46-54
    5.3.1 离线分析阶段  47-49
    5.3.2 XML 特征解析阶段  49-53
    5.3.3 在线识别阶段  53-54
  5.4 实验数据  54
  5.5 实验结果  54-58
    5.5.1 应用层协议在线识别结果  54-55
    5.5.2 算法改进效果验证  55-56
    5.5.3 不同簇数目下识别率比较  56-57
    5.5.4 与基于特征负载的识别方法的比较  57-58
  5.6 性能分析和评估  58-60
    5.6.1 K-means 算法和K-means++算法的比较  58-60
    5.6.2 在线识别阶段的复杂性  60
  5.7 本章小结  60-61
结论  61-63
参考文献  63-67
致谢  67-68
附录 A 攻读学位期间所发表的学术论文目录  68-69
附录 B 攻读学位期间所参与的科研项目  69-70
附录 C 攻读学位期间所申请的专利  70

相似论文

  1. 基因调控网络模型描述语言研究,Q78
  2. 支持XML数据查询的F&B索引结构的研究,TP311.13
  3. LXI自动测试系统集成技术研究,TP274
  4. 基于网络的服装款式设计系统的研究与实现,TS941.2
  5. K-均值聚类算法的研究与改进,TP311.13
  6. 基于MDA的界面自动生成方法的研究,TP311.5
  7. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  8. 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
  9. 基于变异粒子群的聚类算法研究,TP18
  10. K-means聚类优化算法的研究,TP311.13
  11. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  12. 基于遗传算法和粗糙集的聚类算法研究,TP18
  13. C++代码缺陷检测系统的研究与设计,TP311.53
  14. 基于Web的科学计算遗留应用共享技术研究,TP393.09
  15. SAR干涉像对优化选取方法研究,P225.2
  16. 基于XML的异构数据交换系统的设计与实现,TP311.52
  17. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  18. 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
  19. 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
  20. 概率XML数据上关键字检索算法的研究与实现,TP391.3
  21. 行政审批电子监察系统数据交换的设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com