学位论文 > 优秀研究生学位论文题录展示
大规模特征串匹配技术的研究
作 者: 李雪
导 师: 王春露
学 校: 北京邮电大学
专 业: 计算机应用
关键词: 字符串匹配 大规模特征串精确匹配 大规模特征串近似匹配 SRS算法 SrsPex算法
分类号: TP393.08
类 型: 硕士论文
年 份: 2008年
下 载: 340次
引 用: 5次
阅 读: 论文下载
内容摘要
随着计算机网络及其应用的快速发展,人们可以非常便捷地获取所需的信息,计算机网络已经成为人们日常生活中不可缺少的一部分。当我们享受着互联网带来的巨大便利的同时,也受到了非法入侵、攻击、病毒、垃圾邮件等恶意行为的困扰。网络和信息安全问题已经成为网络正常运行和继续发展的重要问题。针对网络上的各种恶意行为,出现了很多不同的防御措施。从早期的防火墙,发展到后来的网络入侵检测/防御系统(IntrutionDetection/Prevention System,IDS/IPS)、病毒扫描系统,垃圾邮件过滤系统,最近又提出了统一威胁管理(Unified Threat Management,UTM)系统。而字符串匹配技术是这些网络信息安全系统和设备的核心技术。随着网络上恶意行为种类和数量的急剧增加,不管是传统的网络入侵检测/防御系统、病毒扫描系统,还是最新的集众多功能于一身的统一威胁管理系统,需要配置的规则数量都急剧增长,少则几万,多则十几万,这就急需大规模特征集的字符串匹配技术。而且,网络的速度越来越快,网络和信息安全系统需要实时在线处理,这就对字符串匹配算法的性能提出了很高的要求。本文的主要目的就是要提出一种适用于大规模特征集的、高性能的字符串匹配算法。本文中研究了大规模特征串匹配技术,包括精确匹配算法和近似匹配算法。通过对经典算法的研究和分析,找到其不适合大规模特征集的瓶颈所在,并提出一种适用于大规模特征集的快速精确匹配算法——SRS算法,该算法性能优异,在特征集达到10万条时,匹配速度比经典算法快10倍以上;另外还给出了一种适用于大规模特征集的高效近似匹配算法——SrsPex算法,该算法在近似特征集规模为1万条时,匹配速度达到100MB/s以上,最高达到近400MB/s。在此基础上,本文从开放源码的反病毒软件ClamAV中提取实际的病毒特征库进行分析,然后用防病毒领域的真实病毒库验证了SRS算法。
|
全文目录
摘要 4-5 ABSTRACT 5-6 目录 6-8 缩略语 8-9 第一章 绪论 9-13 1.1 研究背景 9-10 1.2 国内外相关研究 10-11 1.2.1 特征串精确匹配算法 10-11 1.2.2 特征串近似匹配算法 11 1.3 本文的工作和成果 11 1.4 本文的组织结构 11-13 第二章 大规模特征串精确匹配技术的研究 13-42 2.1 精确匹配技术的国内外研究现状和趋势 13-23 2.1.1 单模式匹配算法 13-15 2.1.2 多模式匹配算法 15-22 2.1.3 各种改进算法 22-23 2.2 经典多模式匹配算法的不足 23-24 2.3 针对大规模特征串精确匹配的改进算法——SRS算法 24-32 2.3.1 SRS算法思想 24-25 2.3.2 SRS算法的结构设计 25-27 2.3.3 shift表和prefix表的建立 27 2.3.4 sub-shift表的建立 27-29 2.3.5 same-pos表的建立 29-31 2.3.6 SRS算法的搜索过程 31 2.3.7 SRS算法优化-特征集合的划分 31-32 2.4 SRS算法模块设计 32-33 2.4.1 模块汇总表 32 2.4.2 模块关系图 32-33 2.5 模块详细设计 33-37 2.5.1 预处理模块设计 33-35 2.5.2 搜索模块设计 35-37 2.6 SRS算法的性能评价 37-41 2.6.1 实验环境描述 37 2.6.2 算法匹配性能比较 37-41 2.7 结束语 41-42 第三章 大规模特征串近似匹配技术的研究 42-64 3.1 近似匹配技术的国内外研究现状和趋势 42-51 3.1.1 近似匹配算法 42 3.1.2 国内外研究现状 42-44 3.1.3 单模式近似特征匹配算法 44-48 3.1.4 多模式近似特征匹配算法 48-51 3.2 经典多模式近似匹配算法的不足 51 3.3 针对大规模特征串近似匹配的改进算法——SrsPex算法 51-53 3.3.1 编辑距离下多模式近似匹配算法 51 3.3.2 SrsPex算法设计思想 51-52 3.3.3 SrsPex算法的结构设计 52-53 3.4 SrsPex算法模块设计 53-54 3.4.1 模块汇总表 53 3.4.2 模块关系图 53-54 3.5 算法详细设计 54-59 3.5.1 数据结构设计 54-55 3.5.2 预处理过程详细设计 55-57 3.5.3 搜索过程详细设计 57-58 3.5.4 BPM算法模块详细设计 58-59 3.6 SrsPex算法的性能评价 59-63 3.6.1 实验环境描述 59 3.6.2 算法匹配性能分析 59-63 3.7 结束语 63-64 第四章 真实病毒特征库对 SRS算法的验证 64-71 4.1 防病毒系统原理 64-65 4.2 采用特征代码法的防病毒系统存在的问题 65 4.3 开源防病毒软件-ClamAV分析 65-67 4.3.1 ClamAV中的核心算法和处理流程 65-66 4.3.2 ClamAV病毒库分析 66-67 4.4 SRS算法在防病毒系统中的应用 67-68 4.5 性能测试与分析 68-70 4.4.1 ClamAV特征集匹配速度比较 68-69 4.4.2 ClamAV特征集占用内存比较 69 4.4.3 ClamAV特征集预处理时间比较 69-70 4.6 结束语 70-71 第五章 总结与展望 71-72 参考文献 72-75 作者攻读学位期间发表的学术论文目录 75 作者攻读学位期间参加的科研项目 75-77 致谢 77
|
相似论文
- 基于CPU+GPU异构平台的字符串匹配算法研究与实现,TP301.6
- 相似字符串匹配过滤算法研究,TP391.1
- 针对大规模URL关键字的多模匹配算法的性能优化,TP309
- 基于串匹配和文本分类的中文网页过滤系统设计,TP393.092
- 出版物审读系统的设计与实现,G231
- 基于Windows API的VB编程题自动评分系统的研究与实现,TP311.52
- 基于后缀语法树的代码抄袭检测研究,TP311.11
- 网络安全隔离设备高速匹配算法的研究与实现,TP393.08
- 基于改进型Bloom Filter的深度包检测技术研究,TP393.08
- 基于HTTP协议面向中文文本的过滤技术研究,TP391.1
- 文本自动标引方法研究与实现,TP391.3
- 全文索引结构的压缩与应用,TP391.3
- 基于协议分析的P2P流量检测技术,TP393.08
- 蠕虫型僵尸工具的传播模型及检测技术研究,TP393.08
- 入侵检测系统中检测引擎的研究与实现,TP393.08
- 对串匹配技术中的Wu-Manber算法的研究,TP301.6
- 高性能精确单模式串匹配算法研究,TP301.6
- 基于Snort系统特殊字符串匹配算法的研究,TP393.08
- 用位并行法进行过滤的中文近似串匹配算法,TP391.1
- 网络入侵检测系统框架的研究及通用测试平台的实现,TP393.08
- 内容过滤防火墙的设计与实现,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络安全
© 2012 www.xueweilunwen.com
|