学位论文 > 优秀研究生学位论文题录展示
面向不同应用类型的在线流量分类特征的研究
作 者: 赵树鹏
导 师: 陈贞翔
学 校: 济南大学
专 业: 计算机应用技术
关键词: 网络流量特征 在线流量分类 特征选择
分类号: TP393.06
类 型: 硕士论文
年 份: 2013年
下 载: 2次
引 用: 0次
阅 读: 论文下载
内容摘要
随着互联网的不断发展,诸如P2P、VoIP等新颖网络应用层出不穷。这些网络应用类型复杂度日益增长,使得网络测量、安全和服务质量保障以及其他网络管理任务面临巨大的挑战。网络流量分类正是解决上述难题的基石,尤其是在线流量分类,能够以实时或者近实时的方式识别出流经监测节点的流量类型,成为新的研究热点。其中,在线流量特征对于构建准确、快速和高效地在线分类模型至关重要,是在线流量分类领域最核心的问题之一。而且,随着流量分类需求的多样化,面向不同应用类型的在线特征成为新的研究热点,被广泛关注。本文首先综述了互联网流量特征在网络流量分类与应用识别领域中的背景和研究现状以及对分类的作用。从在线流量分类的需求出发,按照实时性、低开销和有利于重新训练分类器等原则,从以Moore特征集为代表的统计特征中,挑选出适合于在线流量分类的特征。分别采用3种机器学习算法(C4.5、BayesNet和NBTree)在公开数据集(奥克兰数据集)上均取得了较高的分类准确率(92%以上)。之后,基于课题组所设计的在线流量分类平台,在现实的网络环境中验证了特征的有效性。其次,随着互联网的不断发展,网络的速率变得越来越高,使得网络监测的压力越来越大,尤其在高速网络环境中,数据抽样变得不可避免。这对流量分类系统造成显著地冲击,尤其是对于在线流量分类。本文探索了基于抽样的少数数据包进行在线流量分类,并使用非参数概率密度估计方法分析了特征在不同的数据包抽样条件下的概率分布,结合互信息理论分析了特征与应用类型的相关性,最后结合C4.5分类算法在公开数据集和自己采集的数据集上验证了方法的有效性。最后,鉴于互联网高度的动态可变性、易逝性和不可逆性等特点,当网络环境发生变化时,会出现概念漂移的现象,对在线流量分类造成严重的挑战。据此,本文设计了一种具有自适应的流量特征选择方法,使得在网络环境发生变化时,分类系统能够自动生成与网络环境最契合的特征子集,保证了在线流量分类系统的性能。除此之外,为了应付不断变化的分类需求以及对个别应用类型的独特要求,本文设计了面向不同应用类型的特征子集生成方法,在公开数据集和自己采集的数据集上验证了所提方法的有效性。
|
全文目录
摘要 8-9 Abstract 9-11 第一章 绪论 11-15 1.1 论文的研究对象和内容 11-12 1.2 论文的研究背景和意义 12-13 1.3 论文的主要工作及创新点 13-14 1.3.1 在线流量特征的获取与分析 13 1.3.2 数据包抽样条件下的在线流量分类 13 1.3.3 特征选择对在线流量分类的优化 13-14 1.4 论文的组织结构 14-15 第二章 互联网流量特征的研究现状 15-25 2.1 端口特征 15-17 2.1.1 端口特征的相关概念 15-16 2.1.2 常见的端口特征 16-17 2.1.3 端口特征对流量分类的作用 17 2.2 应用负载特征 17-20 2.2.1 应用负载特征的相关概念 17-18 2.2.2 应用负载特征的分类 18-19 2.2.3 应用负载特征对分类的作用 19-20 2.3 统计特征 20-22 2.3.1 统计特征的定义 20 2.3.2 统计特征的分类 20-21 2.3.3 统计特征对流量分类的作用 21-22 2.4 主机行为特征 22-23 2.5 本章小结 23-25 第三章 在线流量分类特征的研究 25-41 3.1 在线流量分类对流量特征的要求 25-26 3.1.1 实时性要求 25 3.1.2 计算存储要求 25-26 3.1.3 可重新训练分类器 26 3.2 可用于在线流量分类的特征 26-27 3.2.1 选用统计特征的原因 26-27 3.2.2 在统计特征中进行的筛选 27 3.2.3 适用于在线流量分类的特征 27 3.3 模拟条件下验证特征对于在线流量分类的有效性 27-37 3.3.1 数据集 28-29 3.3.2 特征抽取 29-34 3.3.3 分类算法 34-35 3.3.4 结果分析 35-37 3.4 现实网络环境中验证特征对于在线流量分类的有效性 37-40 3.4.1 网络环境以及在线流量分类平台 37-39 3.4.2 实验结果分析 39-40 3.5 本章小结 40-41 第四章 基于抽样数据包的在线流量分类 41-57 4.1 面临的主要问题 41 4.2 基于数据包抽样的在线流量分类方法 41-43 4.3 特征的概率分布 43-47 4.3.1 获取概率分布的方法 43-44 4.3.2 概率分析 44-47 4.4 特征与应用类别的相关性分析 47-50 4.4.1 相关性分析方法 47-48 4.4.2 分析结果 48-50 4.5 不同数据集上的验证 50-55 4.5.1 分类准确率分析 50-53 4.5.2 延时分析 53-54 4.5.3 内存开销分析 54-55 4.6 本章小结 55-57 第五章 面向不同应用类型的流量特征的研究 57-67 5.1 特征选择简述 57-59 5.1.1 特征选择流程 58 5.1.2 特征选择对流量分类的影响 58-59 5.2 动态自适应特征选择机制 59-63 5.2.1 原理 59-60 5.2.2 实验分析 60-63 5.3 面向不同应用类型的特征选择机制 63-66 5.3.1 原理 63-64 5.3.2 实验分析 64-66 5.4 本章小结 66-67 第六章 总结和展望 67-69 参考文献 69-75 致谢 75-77 附录 77-78
|
相似论文
- 半监督学习方法研究,TP181
- 基因表达谱数据特征选择算法研究,Q78
- 基于SVR及特征选择的材料物理性能研究,TB303
- 基于粗糙集属性约简和加权SVM的入侵检测方法研究,TP393.08
- 基于决策树的网络流量分类研究,TP393.06
- 基于内容检索的垃圾邮件过滤器研究与实现,TP393.098
- 关节式物体检测识别及应用,TP391.41
- 基于英文博客空间文本的情感分析研究,TP391.1
- 结合本体HowNet的中文文本分类研究,TP391.1
- 基于互信息频度的特征选择及其在SNP关联分析中的应用,Q987
- 发动机机械故障诊断系统特征提取算法研究,TK407
- 支持向量机在入侵检测系统中的应用,TP18
- 基于特征间合作度的非监督特征选择算法,TP18
- 支持向量机在入侵检测系统中的研究和应用,TP393.08
- 基于最小风险的贝叶斯邮件过滤算法研究,TP393.098
- Web视频资源的智能发现关键技术研究,TP393.092
- 基于机器学习算法的P2P流量分类研究,TP393.02
- 基于聚类分析的网络流量分类研究,TP393.06
- 基于机器学习方法的网络流量分类研究,TP393.06
- 基于贝叶斯理论的网络流量分类研究,TP393.06
- 基于特征选择的轻量级入侵检测系统,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com
|