学位论文 > 优秀研究生学位论文题录展示

基于正则表达式匹配的网络流量识别系统的研究与实现

作 者: 陈传通
导 师: 王风宇
学 校: 山东大学
专 业: 计算机系统结构
关键词: 网络流量识别 DPI 网络流量分布特征 网络协议优先级
分类号: TP393.06
类 型: 硕士论文
年 份: 2013年
下 载: 32次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络技术的高速发展,网络带宽不断增加,网络协议层出不穷,对于网络安全需求日益明显。在此环境下对网络流量识别和分类提出需求。网络流量识别可以用来监测网络运行情况、检测网络入侵、分析网络应用构成、限制网络应用等功能。随着新协议的大量出现和P2P技术的广泛使用,网络应用不再严格遵循特定应用使用特定端口的规则。在此背景下传统基于端口特征的网络流量分类方法变得无能为力。为了准确识别网络流量,人们提出了对网络数据包载荷进行深度检测分析的识别方法。该方法首先对网络数据进行流量恢复,然后提取数据流中的应用层数据载荷。通过应用层数据载荷与各种网络协议规则的匹配,确定该网络数据流的协议类型。该方法被称作深度包检测(Deep Packet Inspection, DPI)。由于正则表达式比精确字符串表达能力更强,在深度包检测方法中,各种网络协议规则多用正则表达式来表示。虽然深度包检测技术对于网络数据流的识别准确性较高,但其识别速度较低,不能满足高速网络带宽环境下识别的要求。在传统深度包检测匹配引擎中,正则表达式规则采用NFA模式来实现,匹配时存在着大量的回溯现象,因而匹配速度较低。为了提高匹配速度可以使用确定型有穷自动机(DFA)方式来实现正则表达式规则。该方法不存在回溯现象且可以通过一次扫描匹配多条正则表达式规则。但确定型有穷自动机规模会随着规则的条数的增加而呈指数倍上升。当规则条数较多时,该引擎甚至由于规模较大而无法实现。本文根据网络上各种网络应用流量分布不均衡这一特点,提出了对网络协议加权设置优先级的识别方法,并提出了具体的加权分组算法。该方法根据协议流量在网络上分布比例的不同,通过分组算法对网络协议进行分组、设置不同的优先级。对于高优先级的网络协议组,采用DFA的形式来实现,对于大量的低优先级的协议组采用混合自动机(Hybrid-FA)的方式来实现。由于DFA分组内规则的条数较少,则与之对应的引擎规模较小。同时由于DFA分组对应的网络流量比重较大,因而大量的未知数据流量经过DFA部分就可以被识别出来。在混合自动机分组内,由于混合自动机使用了DFA头部,则回溯匹配大量减少。该算法可以使网络数据流识别引擎在维持一个较小规模的基础上,大大提高识别速度。通过对实验结果分析可知,该算法相比于传统识别引擎,匹配速度可以提高29倍左右。以本文所提出的加速算法为核心,我们构造了一个网络流量识别系统。该系统分为数据镜像模块,数据识别模块,数据库模块和显示交互模块四部分。该系统通过镜像模块获得网络内的数据,并将镜像数据传送到网络系统的核心模块:网络数据流识别模块。识别模块将识别结果写入数据库模块供显示交互模块使用。系统显示交互模块通过对数据库的操作可以将网络流量识别结果和网络运行情况直观展现给用户。

全文目录


目录  4-6
TABLE OF CONTENTS  6-8
摘要  8-10
ABSTRACT  10-12
第一章 绪论  12-18
  1.1 网络流量识别分类研究的相关背景  12-13
  1.2 应用层网络流量分类的发展  13-15
  1.3 本文研究的主要工作  15-17
  1.4 本文结构  17-18
第二章 网络流量识别和正则表达式  18-28
  2.1 网络流量的基本概念  18-22
    2.1.1 应用层网络流量的定义  18-20
    2.1.2 应用层网络流量识别介绍  20-21
    2.1.3 识别效果的评价指标  21-22
  2.2 正则表达式的相关研究  22-28
    2.2.1 正则表达式的概念  22-23
    2.2.2 正则表达式的元字符  23-24
    2.2.3 正则表达式的实现模式  24-28
第三章 基于正则表达式的网流量识别加速研究  28-37
  3.1 基于正则表达式的网络载荷匹配识别相关研究  28-34
  3.2 网络流量分布特点的识别加速  34-37
    3.2.1 计算机中不均衡现象及其应用  34
    3.2.2 网络数据流的不均衡现象  34-36
    3.2.3 正则表达式中不均衡特点的应用  36-37
第四章 基于流量分布特征的网络流量识别加速实现  37-47
  4.1 采样网络  37-38
  4.2 设置优先级  38-40
  4.3 算法具体实现  40-42
  4.4 算法性能  42-46
  4.5 小结  46-47
第五章 基于特征串的网络流量分类系统  47-57
  5.1 系统总体设计  47-51
    5.1.1 数据镜像模块设计分析  48
    5.1.2 处理模块设计分析  48-49
    5.1.3 数据库设计  49-50
    5.1.4 人机交互模块设计分析  50-51
  5.2 系统实现  51-57
    5.2.1 数据镜像模块实现  51-54
    5.2.2 人机交互模块实现  54-57
第六章 结论和展望  57-59
  6.1 本文工作总结  57-58
  6.2 下一步工作  58-59
参考文献  59-63
致谢  63-64
攻读学位期间发表的学术论文  64-65
攻读学位期间参加的项目  65-66
学位论文评阅及答辩情况表  66

相似论文

  1. 新型抗抑郁药物DPI-289以及API-121的合成研究,R914
  2. 互联网流量应用基准分类技术的研究,TP393.06
  3. P2P流量分析系统监测引擎的研究与实现,TP393.06
  4. 高速接入网络的流量识别特性研究,TP393.06
  5. 网络流量识别特征码自动提取系统的研究与实现,TN915.06
  6. P2P数据流识别与监控技术研究,TP393.06
  7. 局域网下针对P2P流量识别技术的研究与实现,TP393.1
  8. 网络流量识别关键技术研究,TP393.06
  9. 流量分析与流记录分析系统的研究与实现,TN915.06
  10. 水稻质膜NADPH氧化酶对干旱胁迫的响应及其催化特性的研究,S511
  11. IP网流量流向分析及异常流量监控的研究,TN915.07
  12. 基于DPI和DFI的P2P流量检测技术研究,TP393.06
  13. IPv6环境下流量管理系统,TP393.04
  14. IP城域网业务监控系统分析与实现,TP393.06
  15. 网络流量控制及流量分析,TP393.06
  16. 基于DPI和DFI的P2P流量识别设计与实现,TP393.06
  17. 嵌入式喷印系统的设计和实现,TS853.5
  18. 基于硬件支持的高速DPI算法研究,TP393.08
  19. 基于数据包特征的僵尸木马检测技术,TP393.08
  20. 基于校园网的网络流量监控技术研究与应用,TP393.06

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com