学位论文 > 优秀研究生学位论文题录展示

P2P网络深度包业务识别(DPI)方法的改进

作 者: 李鸿斌
导 师: 张顺颐
学 校: 南京邮电大学
专 业: 计算机应用技术
关键词: 对等网络 业务识别 时间复杂度 算法 后缀数组 模式匹配 AC自动机
分类号: TP393.02
类 型: 硕士论文
年 份: 2011年
下 载: 68次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近些年来,P2P(Peer-to-Peer)技术的使用越来越广泛。然而P2P技术给人们带来便利的同时,也造成了不少问题。例如,P2P流量的“带宽吞噬”特性造成了网络带宽的巨大消耗,甚至会引起网络拥塞,大大降低了网络服务性能,劣化了网络服务质量。因此对网络流量中的P2P业务进行识别具有重要的意义。本论文首先简要介绍业务识别的常用方法,即端口号识别方法、机器学习识别方法,分析这两种识别方法的工作原理,比较它们的优点和不足,然后重点介绍业务识别准确性最高的DPI(Deep Packet Identification)识别方法。通过研究,发现DPI方法存在两大问题:1)过于依赖业务的应用层特征码,但是提取业务的应用层特征码比较困难。2)AC自动机算法是一种高效的多模式匹配算法,经常被用于DPI方法里的模式匹配。然而由于AC自动机算法的原理是先离线构造一个匹配模版,然后进行模式匹配,但是当发现一个新的应用层特征码时,必须用所有的应用层特征码重新构造一个匹配模版,所以AC自动机算法的扩展性不佳,降低了它在DPI方法中应用的效率。针对这两个问题,作者提出一种基于后缀数组的算法来高效提取业务的应用层特征码,同时提出一种基于增量式构造AC自动机的匹配模板算法,提高AC自动机算法在DPI方法中的扩展性。论文中将从理论角度证明算法的正确性和高效性,此外还将设计与实现一个采用DPI方法的业务识别仿真系统,并将这两个算法应用此系统中,从实际角度证明这两个算法的正确性和高效性。

全文目录


摘要  4-5
ABSTRACT  5-9
第一章 绪论  9-12
  1.1 研究背景  9
  1.2 研究现状  9-10
  1.3 作者所做工作以及论文创新点  10
  1.4 论文组织结构  10-12
第二章 业务识别的相关方法  12-24
  2.1 端口号识别方法  12
  2.2 机器学习识别方法  12-14
    2.2.1 支持向量机  12-13
    2.2.2 神经网络  13-14
  2.3 DPI方法  14-23
    2.3.1 DPI 方法的原理  14
    2.3.2 DPI 方法的关键点  14-15
    2.3.3 获取应用层特征码的途径  15
    2.3.4 常见的业务的应用层特征码  15
    2.3.5 单模式匹配  15-21
    2.3.6 多模式匹配  21-22
    2.3.7 DPI 方法的不足  22-23
  2.4 本章小结  23-24
第三章 基于后缀数组提取业务应用层特征码算法  24-46
  3.1 基于后缀数组提取业务应用层特征码算法的意义  24
  3.2 求解问题的数学模型及难点  24-27
    3.2.1 建立数学模型  24-25
    3.2.2 求解问题的误区和难点  25-27
  3.3 后缀数组  27-33
    3.3.1 后缀数组的定义  27-28
    3.3.2 后缀数组的构造  28-31
    3.3.3 最长公共前缀的构造  31-33
  3.4 基于后缀数组的最长公共连续子串算法  33-40
    3.4.1 基于后缀数组的最长公共子串算法思想  33-36
    3.4.2 二分算法中一些细节问题  36-37
    3.4.3 判定部分的实现问题  37-40
  3.5 算法的正确性证明  40-42
    3.5.1 证明子串的公共性  40-41
    3.5.2 证明子串的最长性  41-42
  3.6 算法的时间复杂度分析  42-43
    3.6.1 各部分时间复杂度计算  42-43
    3.6.2 整体的时间复杂度计算  43
  3.7 实际环境中对算法的一些改进  43-45
    3.7.1 含有杂质的单个业务的数据包  44-45
    3.7.2 含有多种业务的数据包  45
  3.8 本章小结  45-46
第四章 基于增量式构造AC自动机的匹配模板算法  46-66
  4.1 改进AC自动机算法的意义  46-47
  4.2 离线构造匹配模版  47-52
    4.2.1 构造Trie 树  47-48
    4.2.2 构造失败指针  48-52
  4.3 基于增量式构造AC自动机的匹配模版算法  52-63
    4.3.1 失效节点的位置  52-55
    4.3.2 基于增量式构造AC 自动机的匹配模版算法的基本思想  55-56
    4.3.3 设置新增节点的失败指针的指向  56-57
    4.3.4 更新失效节点的失败指针的指向  57-60
    4.3.5 完整源代码  60-63
  4.4 基于增量式构造 AC自动机的匹配模版算法的正确性分析  63-64
    4.4.1 证明设置新增节点失败指针指向的正确性  64
    4.4.2 证明更新失效节点失败指针指向的正确性  64
  4.5 基于增量式构造 AC自动机的匹配模版算法的时间复杂度  64-65
    4.5.1 插入模式串的时间复杂度  64
    4.5.2 设置新增节点的时间复杂度  64-65
    4.5.3 设置可能失效节点的时间复杂度  65
    4.5.4 时间复杂度对比  65
  4.6 本章小结  65-66
第五章 仿真系统及性能分析  66-80
  5.1 系统开发及运行环境  66
  5.2 系统的功能需求  66
  5.3 系统整体框架设计  66-67
  5.4 系统模块详细介绍  67-73
    5.4.1 系统初始化模块  68
    5.4.2 数据采集模块  68-69
    5.4.3 数据预处理模块  69-71
    5.4.4 识别模块  71-72
    5.4.5 应用层特征码提取模块  72-73
    5.4.6 更新匹配模版模块  73
  5.5 系统功能测试  73-76
    5.5.1 测试业务识别功能  74
    5.5.2 测试提取应用层特征码功能  74-76
    5.5.3 功能测试结果分析  76
  5.6 系统性能分析  76-79
    5.6.1 基于后缀数组提取业务应用层特征码算法性能分析  76-77
    5.6.2 基于增量式构造匹配AC 自动机的匹配模版算法性能分析  77-79
  5.7 本章小结  79-80
第六章 总结与展望  80-82
  6.1 论文总结  80-81
  6.2 进一步工作展望  81-82
参考文献  82-85
缩略词  85-86
致谢  86-87
发表论文  87-88
参加项目  88

相似论文

  1. 基于差分进化算法的JSP环境下成套订单研究,F273
  2. 基于图的标志SNP位点选择算法研究,Q78
  3. 高灵敏度GNSS软件接收机的同步技术研究与实现,P228.4
  4. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  5. 基于Thermo-Calc三元共晶合金凝固路径的耦合计算,TG111.4
  6. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  7. 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
  8. 基于感性负载的车身网络控制系统,U463.6
  9. 基于蚁群算法的电梯群优化控制研究,TU857
  10. 高精度激光跟踪装置闭环控制若干关键问题研究,TN249
  11. 半导体激光器热电控制技术研究,TN248.4
  12. AES算法及其DSP实现,TN918.1
  13. 基于UWB脉冲信号的测距定位技术,TN929.5
  14. 基于TS101的DFT输出子集算法研究及软件实现,TN911.72
  15. 高光谱图像空—谱协同超分辨处理研究,TN911.73
  16. DBF接收机用于二维测向算法的研究,TN851
  17. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  18. IEEE802.16e信道编译码算法研究,TN911.22
  19. LDPC码译码算法的研究,TN911.22
  20. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  21. 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络结构与设计
© 2012 www.xueweilunwen.com