学位论文 > 优秀研究生学位论文题录展示

基于多特征匹配的P2P流量检测关键技术研究

作 者: 龙坤
导 师: 陈庶樵
学 校: 解放军信息工程大学
专 业: 通信与信息系统
关键词: P2P特征 多特征匹配 跨层检测 机器学习 半监督离线训练 高速检测
分类号: TP393.06
类 型: 硕士论文
年 份: 2009年
下 载: 71次
引 用: 0次
阅 读: 论文下载
 

内容摘要


P2P业务流量占据大量网络带宽资源,同时带来网络安全问题和版权纠纷。P2P应用采用动态随机端口、数据加密和协议伪装等新技术以逃避传统的检测技术,加大了网络流量检测与监管的难度,使得网络运营商对网络应用的掌控能力进一步下降,无法满足网络精细运营的要求。对P2P业务流量进行准确、高效的检测是实现对网络流量管控的根本前提和关键。本文结合国家863计划“十一五”重大项目“新一代高可信网络”总体技术相关课题的研究需求,重点研究P2P业务流量特征和P2P流量检测的关键技术,为实现“高可信”质量水准的网络应用服务和网络业务精细管理提供有力的技术支持。本文主要的研究工作如下:分析了P2P应用网络节点行为特征和P2P业务流特征。对比研究了4种主流的P2P流量检测方法及性能不足,指出多种检测技术综合运用的方法将成为未来P2P流量检测技术发展方向。提出了一种基于多特征匹配的P2P流量综合检测方案。提出了综合PTITB (P2P Traffic Identification Algorithm based on Transport-layer Behaviors)算法和应用层深度报文检测的P2P流量跨层检测方法。该方法可以有效识别P2P加密流量和动态随机端口流量,检测效率高于单纯的深度报文检测方法,解决了基于传输层行为特征的P2P流量识别方法应用分类能力差的缺陷。分析了基于机器学习的P2P流量识别方法存在的不足,提出了一种基于半监督聚类学习的离线训练方法和改进的K-均值在线识别方法。经过簇评估,半监督离线训练方法产生子簇质量优于传统聚类算法。改进的在线识别方法可以有效识别P2P业务流量,对新型应用类型流量检测率高于传统K-均值算法。提出了一种基于抽样的多特征匹配P2P流量高速检测方案,并对关键模块给出详细设计。经过分析验证,该方案可以应用于高速链路上的P2P实时在线检测,具有较高的实用价值。

全文目录


表目录  7-8
图目录  8-10
摘要  10-11
ABSTRACT  11-12
第一章 绪论  12-17
  1.1 课题研究背景  12-13
    1.1.1 P2P 流量检测的背景  12-13
    1.1.2 课题来源、目的和意义  13
  1.2 P2P 流量检测技术研究现状  13-14
    1.2.1 P2P 流量检测技术现状  13-14
    1.2.2 P2P 流量检测技术发展趋势  14
  1.3 主要工作与成果  14-15
  1.4 论文结构安排  15-17
第二章 P2P 流量特征分析与流量检测技术比较研究  17-27
  2.1 引言  17
  2.2 P2P 网络节点行为特征分析  17-19
    2.2.1 P2P 节点的双重角色  17
    2.2.2 P2P 节点TCP/UDP 并发连接特征  17-18
    2.2.3 P2P 应用动态端口特点  18
    2.2.4 P2P 网络节点关联特征  18-19
    2.2.5 P2P 系统节点行为特征比较分析  19
  2.3 P2P 业务流量特征分析  19-21
    2.3.1 信令流量特征分析  19-20
    2.3.2 文件共享下载流量特征分析  20-21
    2.3.3 P2P 实时业务流量特征分析  21
  2.4 P2P 流量检测技术比较研究  21-24
    2.4.1 主流P2P 流量检测技术分析  21-24
    2.4.2 P2P 流量检测技术比较及展望  24
  2.5 基于多特征匹配的P2P 流量检测系统框架  24-26
  2.6 本章小结  26-27
第三章 基于PTITB 算法的P2P 业务流量跨层检测  27-38
  3.1 引言  27
  3.2 基于行为特征的P2P 流量识别条件  27-29
    3.2.1 P2P 对等体节点连接特征分析  27-28
    3.2.2 P2P 应用使用固定端口特征  28-29
  3.3 P2P 业务流量跨层检测方法  29-34
    3.3.1 基本思想  29-30
    3.3.2 基于传输层行为特征的P2P 业务流量识别算法(PTITB)  30-31
    3.3.3 基于主动识别策略的P2P 动态随机端口检测  31-33
    3.3.4 DPI 深度报文检测模块匹配策略  33-34
  3.4 性能分析  34-37
    3.4.1 检测效率分析  34
    3.4.2 实验条件  34
    3.4.3 识别精度性能及结果分析  34-36
    3.4.4 PTITB 算法参数讨论  36-37
  3.5 本章小结  37-38
第四章 基于半监督聚类学习的P2P 业务流在线识别方法  38-55
  4.1 引言  38
  4.2 基于统计特征的P2P 业务流描述  38-41
    4.2.1 基于改进统计量的TCP 业务流描述  38-40
    4.2.2 P2P 实时业务流量源模型  40-41
    4.2.3 基于w 窗口UDP 包长时间分布的P2P 实时业务流描述  41
  4.3 基于半监督聚类学习的P2P 业务流量快速识别方法  41-49
    4.3.1 基本思想  41-42
    4.3.2 基于半监督学习的离线聚类方法  42-45
    4.3.3 基于正态分布的数据点分配策略  45-46
    4.3.4 改进的在线K-Means 聚类算法  46-48
    4.3.5 数据点标识策略及协议伪装流量识别  48-49
  4.4 算法性能评估  49-50
    4.4.1 簇评估  49
    4.4.2 检测性能评价指标  49-50
  4.5 实验测试及结果分析  50-53
  4.6 本章小节  53-55
第五章 基于分组抽样多特征匹配的P2P 流量高速检测方案  55-65
  5.1 引言  55
  5.2 基于分组抽样多特征匹配的P2P 流量检测方案模型  55-58
    5.2.1 基本思想  55-57
    5.2.2 系统模块功能说明及性能需求分析  57-58
  5.3 P2P“超级节点”检测模块设计方案  58-63
    5.3.1 基本原理  58-59
    5.3.2 自适应随机抽样模块设计及可行性分析  59
    5.3.3 基于PTITB 算法的P2P 流量检测模块设计及可行性分析  59-60
    5.3.4 P2P 节点在线关联模块设计及列表管理策略  60-63
  5.4 基于机器学习的P2P 流量检测模块  63-64
  5.5 本章小节  64-65
结束语  65-67
参考文献  67-70
附录  70-71
作者简历 攻读硕士学位期间完成的主要工作  71-72
致谢  72

相似论文

  1. 英汉命名实体翻译方法研究,TP391.2
  2. 基于数据分布特征的文本分类研究,TP391.1
  3. 人类抗原肽载体结合力预测,R392.1
  4. 李群深层结构学习算法研究,TP181
  5. 机器学习算法在视频指纹识别中的应用研究,TP391.41
  6. 蛋白质关系抽取中平面特征和结构化信息的研究,TP181
  7. 基于李群机器学习算法的智能布线,TN710
  8. 学习表达式的映射机制研究,TP181
  9. 军事港口目标分类平台的设计与实现,TP751
  10. 基于多视角的分类器设计与权值优化方法研究,TP18
  11. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  12. 基于区域高斯特征的人体检测算法,TP391.41
  13. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  14. Android恶意软件静态检测方案的研究,TP309
  15. 基于马尔可夫链蒙特卡罗方法的RBM学习算法改进,O211.62
  16. 基于配体结构的药物靶标预测及细胞色素P450酶代谢底物数据库CYP-Meta的构建,R91
  17. 监督主题模型的研究与应用,TP391.1
  18. 基于失真效应的图像质量评价与分类,TP391.41
  19. 基于学习的逆向运动学人体运动合成,TP391.41
  20. 基于内容的网页恶意代码检测的研究与实现,TP393.092
  21. 学术主页信息抽取系统的研究,TP393.092

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com