学位论文 > 优秀研究生学位论文题录展示
基于聚类算法的流量识别方法研究及系统实现
作 者: 苏欣
导 师: 张大方;谢高岗
学 校: 湖南大学
专 业: 软件工程
关键词: 流量识别 聚类算法 XML K-means算法
分类号: TP393.06
类 型: 硕士论文
年 份: 2008年
下 载: 130次
引 用: 1次
阅 读: 论文下载
内容摘要
准确而快速的识别流量是确保网络安全和流量控制的基础。尤其是在如今Internet技术飞速发展,不断涌现出新型的协议及应用软件,如P2P(Peer-To-Peer)等。新业务不断增加,使得出口网络带宽利用率居高不下,甚至引起网络拥塞,对于企业或者校园网络来说尤为明显。同时,通过不安全的网络环境获得的应用程序,可能使得病毒和恶意代码入侵。本文的主要工作如下:1.研究了应用在网络传输的各个属性,以及几种面向流量识别的聚类算法,并分析了各个属性的优势和劣势,以及面向流量识别的聚类算法的优点和存在的缺陷,为本文的研究目标确定了方向。2.在流量识别算法设计环节,首先本文确定了以应用在进行网络连接时候的前4个数据包的长度和方向为流量识别指标;其次,以K-means算法为例,由于原始的K-means算法的初始化簇中心的选择存在缺陷,通过对这个环节的改进,并引入NMI值来对聚类效果进行验证,得到了一种改进的K-means算法,使用这个算法来对所选取的识别指标进行聚类和特征提取。3.在聚类算法提取出特征后,针对现今网络流量的特征变化较快,而修改程序中的特征参数带来编译时间较长,降低系统性能的问题。本文提出使用XML脚本语言来对流量特征进行描述,程序通过读取特征描述文件在线匹配流量。这种方法在遇到特征变化的时候,只需修改脚本文件里面的特征参数即可。4.基于上述3点,本文设计与实现了基于聚类算法的流量识别系统。该系统能支持多种聚类算法,并将所得到的流量特征使用XML脚本语言描述。通过加载特征描述文件来在线识别流量。
|
全文目录
摘要 5-6 ABSTRACT 6-13 第1章 绪论 13-20 1.1 选题背景及意义 13-15 1.2 国内外研究现状和已有成果 15-17 1.2.1 基于端口识别方法 15-16 1.2.2 基于负载识别方法 16-17 1.2.3 基于测度识别方法 17 1.2.4 综合方法 17 1.3 论文的研究思路和主要工作 17-18 1.4 论文的结构 18-20 第2章 面向流量识别的聚类算法研究与分析 20-33 2.1 数据挖掘技术介绍 20-23 2.2 聚类技术介绍 23-25 2.3 聚类算法 25-27 2.4 K-MEANS 算法 27-30 2.4.1 K-means 算法基本思想 27-28 2.4.2 K-means 算法分析 28-30 2.5 DBSCAN 算法 30-31 2.5.1 DBSCAN 算法基本思想 30-31 2.5.2 DBSCAN 算法分析 31 2.6 K-MEDOIDS 算法 31-32 2.6.1 K-medoids 算法基本思想 31 2.6.2 K-medoids 算法分析 31-32 2.7 已有的基于聚类分析的流量识别方法 32 2.8 本章小结 32-33 第3章 基于K-MEANS++的流量识别算法设计 33-41 3.1 识别测度的选择 33-37 3.1.1 先前的研究 33 3.1.2 合适的识别测度 33-37 3.2 识别测度的提取 37 3.3 训练数据集 37 3.4 K-MEANS++算法聚类 37-40 3.4.1 初始化簇中心的选择 37-38 3.4.2 簇质量优化 38-40 3.5 在线识别 40 3.6 本章小结 40-41 第4章 基于XML 脚本语言的流量特征描述方法 41-46 4.1 XML 介绍 41-42 4.2 描述方法 42-44 4.2.1 基本协议描述规则 42-43 4.2.2 XML 文件解析方法 43-44 4.2.3 匹配过程 44 4.3 性能对比 44-45 4.4 本章小结 45-46 第5章 基于聚类算法的流量识别系统实现和验证 46-61 5.1 系统功能需求 46 5.2 系统运行的软硬件环境 46 5.3 基于聚类算法的流量识别系统设计实现 46-54 5.3.1 离线分析阶段 47-49 5.3.2 XML 特征解析阶段 49-53 5.3.3 在线识别阶段 53-54 5.4 实验数据 54 5.5 实验结果 54-58 5.5.1 应用层协议在线识别结果 54-55 5.5.2 算法改进效果验证 55-56 5.5.3 不同簇数目下识别率比较 56-57 5.5.4 与基于特征负载的识别方法的比较 57-58 5.6 性能分析和评估 58-60 5.6.1 K-means 算法和K-means++算法的比较 58-60 5.6.2 在线识别阶段的复杂性 60 5.7 本章小结 60-61 结论 61-63 参考文献 63-67 致谢 67-68 附录 A 攻读学位期间所发表的学术论文目录 68-69 附录 B 攻读学位期间所参与的科研项目 69-70 附录 C 攻读学位期间所申请的专利 70
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- LXI自动测试系统集成技术研究,TP274
- 基于网络的服装款式设计系统的研究与实现,TS941.2
- K-均值聚类算法的研究与改进,TP311.13
- 基于MDA的界面自动生成方法的研究,TP311.5
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
- 基于变异粒子群的聚类算法研究,TP18
- K-means聚类优化算法的研究,TP311.13
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- C++代码缺陷检测系统的研究与设计,TP311.53
- 基于Web的科学计算遗留应用共享技术研究,TP393.09
- SAR干涉像对优化选取方法研究,P225.2
- 基于XML的异构数据交换系统的设计与实现,TP311.52
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
- 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
- 概率XML数据上关键字检索算法的研究与实现,TP391.3
- 行政审批电子监察系统数据交换的设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com
|