学位论文 > 优秀研究生学位论文题录展示
P2P网络深度包业务识别(DPI)方法的改进
作 者: 李鸿斌
导 师: 张顺颐
学 校: 南京邮电大学
专 业: 计算机应用技术
关键词: 对等网络 业务识别 时间复杂度 算法 后缀数组 模式匹配 AC自动机
分类号: TP393.02
类 型: 硕士论文
年 份: 2011年
下 载: 68次
引 用: 0次
阅 读: 论文下载
内容摘要
近些年来,P2P(Peer-to-Peer)技术的使用越来越广泛。然而P2P技术给人们带来便利的同时,也造成了不少问题。例如,P2P流量的“带宽吞噬”特性造成了网络带宽的巨大消耗,甚至会引起网络拥塞,大大降低了网络服务性能,劣化了网络服务质量。因此对网络流量中的P2P业务进行识别具有重要的意义。本论文首先简要介绍业务识别的常用方法,即端口号识别方法、机器学习识别方法,分析这两种识别方法的工作原理,比较它们的优点和不足,然后重点介绍业务识别准确性最高的DPI(Deep Packet Identification)识别方法。通过研究,发现DPI方法存在两大问题:1)过于依赖业务的应用层特征码,但是提取业务的应用层特征码比较困难。2)AC自动机算法是一种高效的多模式匹配算法,经常被用于DPI方法里的模式匹配。然而由于AC自动机算法的原理是先离线构造一个匹配模版,然后进行模式匹配,但是当发现一个新的应用层特征码时,必须用所有的应用层特征码重新构造一个匹配模版,所以AC自动机算法的扩展性不佳,降低了它在DPI方法中应用的效率。针对这两个问题,作者提出一种基于后缀数组的算法来高效提取业务的应用层特征码,同时提出一种基于增量式构造AC自动机的匹配模板算法,提高AC自动机算法在DPI方法中的扩展性。论文中将从理论角度证明算法的正确性和高效性,此外还将设计与实现一个采用DPI方法的业务识别仿真系统,并将这两个算法应用此系统中,从实际角度证明这两个算法的正确性和高效性。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第一章 绪论 9-12 1.1 研究背景 9 1.2 研究现状 9-10 1.3 作者所做工作以及论文创新点 10 1.4 论文组织结构 10-12 第二章 业务识别的相关方法 12-24 2.1 端口号识别方法 12 2.2 机器学习识别方法 12-14 2.2.1 支持向量机 12-13 2.2.2 神经网络 13-14 2.3 DPI方法 14-23 2.3.1 DPI 方法的原理 14 2.3.2 DPI 方法的关键点 14-15 2.3.3 获取应用层特征码的途径 15 2.3.4 常见的业务的应用层特征码 15 2.3.5 单模式匹配 15-21 2.3.6 多模式匹配 21-22 2.3.7 DPI 方法的不足 22-23 2.4 本章小结 23-24 第三章 基于后缀数组提取业务应用层特征码算法 24-46 3.1 基于后缀数组提取业务应用层特征码算法的意义 24 3.2 求解问题的数学模型及难点 24-27 3.2.1 建立数学模型 24-25 3.2.2 求解问题的误区和难点 25-27 3.3 后缀数组 27-33 3.3.1 后缀数组的定义 27-28 3.3.2 后缀数组的构造 28-31 3.3.3 最长公共前缀的构造 31-33 3.4 基于后缀数组的最长公共连续子串算法 33-40 3.4.1 基于后缀数组的最长公共子串算法思想 33-36 3.4.2 二分算法中一些细节问题 36-37 3.4.3 判定部分的实现问题 37-40 3.5 算法的正确性证明 40-42 3.5.1 证明子串的公共性 40-41 3.5.2 证明子串的最长性 41-42 3.6 算法的时间复杂度分析 42-43 3.6.1 各部分时间复杂度计算 42-43 3.6.2 整体的时间复杂度计算 43 3.7 实际环境中对算法的一些改进 43-45 3.7.1 含有杂质的单个业务的数据包 44-45 3.7.2 含有多种业务的数据包 45 3.8 本章小结 45-46 第四章 基于增量式构造AC自动机的匹配模板算法 46-66 4.1 改进AC自动机算法的意义 46-47 4.2 离线构造匹配模版 47-52 4.2.1 构造Trie 树 47-48 4.2.2 构造失败指针 48-52 4.3 基于增量式构造AC自动机的匹配模版算法 52-63 4.3.1 失效节点的位置 52-55 4.3.2 基于增量式构造AC 自动机的匹配模版算法的基本思想 55-56 4.3.3 设置新增节点的失败指针的指向 56-57 4.3.4 更新失效节点的失败指针的指向 57-60 4.3.5 完整源代码 60-63 4.4 基于增量式构造 AC自动机的匹配模版算法的正确性分析 63-64 4.4.1 证明设置新增节点失败指针指向的正确性 64 4.4.2 证明更新失效节点失败指针指向的正确性 64 4.5 基于增量式构造 AC自动机的匹配模版算法的时间复杂度 64-65 4.5.1 插入模式串的时间复杂度 64 4.5.2 设置新增节点的时间复杂度 64-65 4.5.3 设置可能失效节点的时间复杂度 65 4.5.4 时间复杂度对比 65 4.6 本章小结 65-66 第五章 仿真系统及性能分析 66-80 5.1 系统开发及运行环境 66 5.2 系统的功能需求 66 5.3 系统整体框架设计 66-67 5.4 系统模块详细介绍 67-73 5.4.1 系统初始化模块 68 5.4.2 数据采集模块 68-69 5.4.3 数据预处理模块 69-71 5.4.4 识别模块 71-72 5.4.5 应用层特征码提取模块 72-73 5.4.6 更新匹配模版模块 73 5.5 系统功能测试 73-76 5.5.1 测试业务识别功能 74 5.5.2 测试提取应用层特征码功能 74-76 5.5.3 功能测试结果分析 76 5.6 系统性能分析 76-79 5.6.1 基于后缀数组提取业务应用层特征码算法性能分析 76-77 5.6.2 基于增量式构造匹配AC 自动机的匹配模版算法性能分析 77-79 5.7 本章小结 79-80 第六章 总结与展望 80-82 6.1 论文总结 80-81 6.2 进一步工作展望 81-82 参考文献 82-85 缩略词 85-86 致谢 86-87 发表论文 87-88 参加项目 88
|
相似论文
- 基于差分进化算法的JSP环境下成套订单研究,F273
- 基于图的标志SNP位点选择算法研究,Q78
- 高灵敏度GNSS软件接收机的同步技术研究与实现,P228.4
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 基于Thermo-Calc三元共晶合金凝固路径的耦合计算,TG111.4
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
- 基于感性负载的车身网络控制系统,U463.6
- 基于蚁群算法的电梯群优化控制研究,TU857
- 高精度激光跟踪装置闭环控制若干关键问题研究,TN249
- 半导体激光器热电控制技术研究,TN248.4
- AES算法及其DSP实现,TN918.1
- 基于UWB脉冲信号的测距定位技术,TN929.5
- 基于TS101的DFT输出子集算法研究及软件实现,TN911.72
- 高光谱图像空—谱协同超分辨处理研究,TN911.73
- DBF接收机用于二维测向算法的研究,TN851
- 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
- IEEE802.16e信道编译码算法研究,TN911.22
- LDPC码译码算法的研究,TN911.22
- 频繁图结构并行挖掘算法的研究与实现,TP311.13
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络结构与设计
© 2012 www.xueweilunwen.com
|