学位论文 > 优秀研究生学位论文题录展示
基于多特征匹配的P2P流量检测关键技术研究
作 者: 龙坤
导 师: 陈庶樵
学 校: 解放军信息工程大学
专 业: 通信与信息系统
关键词: P2P特征 多特征匹配 跨层检测 机器学习 半监督离线训练 高速检测
分类号: TP393.06
类 型: 硕士论文
年 份: 2009年
下 载: 71次
引 用: 0次
阅 读: 论文下载
内容摘要
P2P业务流量占据大量网络带宽资源,同时带来网络安全问题和版权纠纷。P2P应用采用动态随机端口、数据加密和协议伪装等新技术以逃避传统的检测技术,加大了网络流量检测与监管的难度,使得网络运营商对网络应用的掌控能力进一步下降,无法满足网络精细运营的要求。对P2P业务流量进行准确、高效的检测是实现对网络流量管控的根本前提和关键。本文结合国家863计划“十一五”重大项目“新一代高可信网络”总体技术相关课题的研究需求,重点研究P2P业务流量特征和P2P流量检测的关键技术,为实现“高可信”质量水准的网络应用服务和网络业务精细管理提供有力的技术支持。本文主要的研究工作如下:分析了P2P应用网络节点行为特征和P2P业务流特征。对比研究了4种主流的P2P流量检测方法及性能不足,指出多种检测技术综合运用的方法将成为未来P2P流量检测技术发展方向。提出了一种基于多特征匹配的P2P流量综合检测方案。提出了综合PTITB (P2P Traffic Identification Algorithm based on Transport-layer Behaviors)算法和应用层深度报文检测的P2P流量跨层检测方法。该方法可以有效识别P2P加密流量和动态随机端口流量,检测效率高于单纯的深度报文检测方法,解决了基于传输层行为特征的P2P流量识别方法应用分类能力差的缺陷。分析了基于机器学习的P2P流量识别方法存在的不足,提出了一种基于半监督聚类学习的离线训练方法和改进的K-均值在线识别方法。经过簇评估,半监督离线训练方法产生子簇质量优于传统聚类算法。改进的在线识别方法可以有效识别P2P业务流量,对新型应用类型流量检测率高于传统K-均值算法。提出了一种基于抽样的多特征匹配P2P流量高速检测方案,并对关键模块给出详细设计。经过分析验证,该方案可以应用于高速链路上的P2P实时在线检测,具有较高的实用价值。
|
全文目录
表目录 7-8 图目录 8-10 摘要 10-11 ABSTRACT 11-12 第一章 绪论 12-17 1.1 课题研究背景 12-13 1.1.1 P2P 流量检测的背景 12-13 1.1.2 课题来源、目的和意义 13 1.2 P2P 流量检测技术研究现状 13-14 1.2.1 P2P 流量检测技术现状 13-14 1.2.2 P2P 流量检测技术发展趋势 14 1.3 主要工作与成果 14-15 1.4 论文结构安排 15-17 第二章 P2P 流量特征分析与流量检测技术比较研究 17-27 2.1 引言 17 2.2 P2P 网络节点行为特征分析 17-19 2.2.1 P2P 节点的双重角色 17 2.2.2 P2P 节点TCP/UDP 并发连接特征 17-18 2.2.3 P2P 应用动态端口特点 18 2.2.4 P2P 网络节点关联特征 18-19 2.2.5 P2P 系统节点行为特征比较分析 19 2.3 P2P 业务流量特征分析 19-21 2.3.1 信令流量特征分析 19-20 2.3.2 文件共享下载流量特征分析 20-21 2.3.3 P2P 实时业务流量特征分析 21 2.4 P2P 流量检测技术比较研究 21-24 2.4.1 主流P2P 流量检测技术分析 21-24 2.4.2 P2P 流量检测技术比较及展望 24 2.5 基于多特征匹配的P2P 流量检测系统框架 24-26 2.6 本章小结 26-27 第三章 基于PTITB 算法的P2P 业务流量跨层检测 27-38 3.1 引言 27 3.2 基于行为特征的P2P 流量识别条件 27-29 3.2.1 P2P 对等体节点连接特征分析 27-28 3.2.2 P2P 应用使用固定端口特征 28-29 3.3 P2P 业务流量跨层检测方法 29-34 3.3.1 基本思想 29-30 3.3.2 基于传输层行为特征的P2P 业务流量识别算法(PTITB) 30-31 3.3.3 基于主动识别策略的P2P 动态随机端口检测 31-33 3.3.4 DPI 深度报文检测模块匹配策略 33-34 3.4 性能分析 34-37 3.4.1 检测效率分析 34 3.4.2 实验条件 34 3.4.3 识别精度性能及结果分析 34-36 3.4.4 PTITB 算法参数讨论 36-37 3.5 本章小结 37-38 第四章 基于半监督聚类学习的P2P 业务流在线识别方法 38-55 4.1 引言 38 4.2 基于统计特征的P2P 业务流描述 38-41 4.2.1 基于改进统计量的TCP 业务流描述 38-40 4.2.2 P2P 实时业务流量源模型 40-41 4.2.3 基于w 窗口UDP 包长时间分布的P2P 实时业务流描述 41 4.3 基于半监督聚类学习的P2P 业务流量快速识别方法 41-49 4.3.1 基本思想 41-42 4.3.2 基于半监督学习的离线聚类方法 42-45 4.3.3 基于正态分布的数据点分配策略 45-46 4.3.4 改进的在线K-Means 聚类算法 46-48 4.3.5 数据点标识策略及协议伪装流量识别 48-49 4.4 算法性能评估 49-50 4.4.1 簇评估 49 4.4.2 检测性能评价指标 49-50 4.5 实验测试及结果分析 50-53 4.6 本章小节 53-55 第五章 基于分组抽样多特征匹配的P2P 流量高速检测方案 55-65 5.1 引言 55 5.2 基于分组抽样多特征匹配的P2P 流量检测方案模型 55-58 5.2.1 基本思想 55-57 5.2.2 系统模块功能说明及性能需求分析 57-58 5.3 P2P“超级节点”检测模块设计方案 58-63 5.3.1 基本原理 58-59 5.3.2 自适应随机抽样模块设计及可行性分析 59 5.3.3 基于PTITB 算法的P2P 流量检测模块设计及可行性分析 59-60 5.3.4 P2P 节点在线关联模块设计及列表管理策略 60-63 5.4 基于机器学习的P2P 流量检测模块 63-64 5.5 本章小节 64-65 结束语 65-67 参考文献 67-70 附录 70-71 作者简历 攻读硕士学位期间完成的主要工作 71-72 致谢 72
|
相似论文
- 英汉命名实体翻译方法研究,TP391.2
- 基于数据分布特征的文本分类研究,TP391.1
- 人类抗原肽载体结合力预测,R392.1
- 李群深层结构学习算法研究,TP181
- 机器学习算法在视频指纹识别中的应用研究,TP391.41
- 蛋白质关系抽取中平面特征和结构化信息的研究,TP181
- 基于李群机器学习算法的智能布线,TN710
- 学习表达式的映射机制研究,TP181
- 军事港口目标分类平台的设计与实现,TP751
- 基于多视角的分类器设计与权值优化方法研究,TP18
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 基于区域高斯特征的人体检测算法,TP391.41
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- Android恶意软件静态检测方案的研究,TP309
- 基于马尔可夫链蒙特卡罗方法的RBM学习算法改进,O211.62
- 基于配体结构的药物靶标预测及细胞色素P450酶代谢底物数据库CYP-Meta的构建,R91
- 监督主题模型的研究与应用,TP391.1
- 基于失真效应的图像质量评价与分类,TP391.41
- 基于学习的逆向运动学人体运动合成,TP391.41
- 基于内容的网页恶意代码检测的研究与实现,TP393.092
- 学术主页信息抽取系统的研究,TP393.092
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com
|