学位论文 > 优秀研究生学位论文题录展示

基于海量数据的内容过滤系统的研究

作 者: 梁威
导 师: 叶猛
学 校: 武汉邮电科学研究院
专 业: 通信与信息系统
关键词: 海量数据 过滤系统 模式匹配算法 数据包捕获 协议识别
分类号: TP393.08
类 型: 硕士论文
年 份: 2012年
下 载: 1次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网的飞速发展,网络应用普及率越来越高,伴随而来是的网络上传输的数据量的爆发式增长。人们享受了网络带来的诸多便利的同时,也面临着前所未有的信息安全威胁,例如,恶意病毒,淫秽、反动内容,网络犯罪行为日益严重,人民的日常生活和国家安全都面临着严重威胁,因此,对互联网内容进行有效监控和管理、打击网络违法犯罪行为刻不容缓。数据内容过滤系统就这样一种针对网络数据内容进行监控的专业系统。数据内容过滤系统及其关键技术已成为当前网络安全领域关注的焦点,本文提出了一种基于海量数据的内容过滤过滤系统模型,同时对数据包捕获、负载均衡算法以、应用协议还原等方面进行了探讨,并对匹配算法进行了深入研究。主要内容有一下四个方面:(1)提出了基于海量数据的内容过滤系统的结构模型。该模型对系统按功能进行划分,能够在低丢包率的情况下快速分析和过滤海量网络数据内容;(2)针对当前的核心网络中数据流量远远超过处理机的处理能力问题,提出了一种新的负载均衡算法。算法将核心网络中的海量数据按照一定规则分发给多个数据分析处理主机,分发过程中可以确保同一会话的数据交给同一还原机进行处理,从而避免了丢包的情况发生,保证了数据的完整性;(3)针对当前网络承载的应用层协议种类繁多、不易识别的问题,提出了一种针对应用层协议分析与还原的方案。该方案根据端口号、负载以及流行为综合方式来识别应用层协议。该算法能够快速识别应用协议,准确率达到99%以上;(4)提出了一种新的模式匹配算法。为了应对当前不断增加的网络数据量对网络安全造成的威胁,本文提出了一种新的模式匹配算法,并将其应用到海量数据过滤系统中。改进后的算法明显减少了匹配时间,提高了海量数据过滤系统执行效率;(5)提出了一种基于Linux系统内核模式进行网络数据包捕获和处理的方案,并对TCP/IP协议数据还原模块进行了详细讲解。

全文目录


摘要  3-4
Abstract  4-9
第1章 绪论  9-13
  1.1 课题研究背景及意义  9
  1.2 本课题国内外研究现状  9-11
    1.2.1 国外研究现状  9-10
    1.2.2 国内研究现状  10-11
  1.3 存在问题  11-12
  1.4 本课题主要内容及创新点  12-13
第2章 基于互联网的内容过滤系统关键技术研究  13-30
  2.1 互联网综述  13-18
    2.1.1 互联网概念  13
    2.1.2 互联网发展现状及发展趋势  13-17
    2.1.3 互联网信息安全的重要性  17-18
  2.2 过滤系统功能架构  18-19
  2.3 网络数据包截获技术  19-24
    2.3.1 数据包截获方法  19-20
    2.3.2 Linux系统网络数据包捕获技术  20-23
    2.3.3 负载均衡算法  23-24
  2.4 应用协议识别技术  24-28
    2.4.1 应用协议识别的基本方法  24-26
    2.4.2 应用协议内容还原实例  26-28
  2.5 模式匹配技术  28-29
  2.6 系统的性能瓶颈  29
  2.7 本章小结  29-30
第3章 模式匹配算法及其改进  30-47
  3.1 经典单模式匹配算法  30-35
    3.1.1 BF算法  30-31
    3.1.2 KMP算法  31-33
    3.1.3 BM算法  33-35
  3.2 经典多模式匹配算法  35-39
    3.2.1 AC算法  35-38
    3.2.2 AC-BM算法  38-39
  3.3 影响模式匹配算法的主要因素  39-40
  3.4 改进的AC-BM算法  40-42
    3.4.1 预处理阶段  40
    3.4.2 匹配阶段  40-42
  3.5 改进算法复杂度分析  42-43
  3.6 改进算法性能对比测试  43-45
    3.6.1 对比测试环境  43
    3.6.2 对比测试结果  43-45
  3.7 本章小结  45-47
第4章 系统关键模块设计及性能测试  47-64
  4.1 LINUX下内核模块设计  47-53
    4.1.1 网络驱动程序设计  47-49
    4.1.2 网络驱动程序实现  49-53
  4.2 TCP处理模块设计  53-58
    4.2.1 TCP/IP协议原理  54-56
    4.2.2 数据报还原方案  56-58
  4.3 系统测试  58-63
    4.3.1 测试环境  58-60
    4.3.2 系统功能测试与结果  60
    4.3.3 系统性能测试与结果  60-63
  4.4 本章小结  63-64
第5章 总结与展望  64-66
参考文献  66-68
致谢  68-69
附录1 攻读硕士学位期间发表的论文  69-70
附录2 主要英文缩写语对照表  70

相似论文

  1. 海量数据压缩、操作和处理方法的研究,TP311.13
  2. 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
  3. 应用层协议识别和还原方法的研究与实现,TP393.08
  4. 地理空间数据组织及调度的研究与实现,P208
  5. HTTP协议还原系统的设计与实现,TP393.04
  6. Windows系统内核Rootkit的检测技术研究,TP309
  7. 分布式实时P2P检测系统研究与实现,TP393.02
  8. 基于PCI-E接口数据采集系统软件设计与实现,TP274.2
  9. 云环境下MapReduce容错技术的研究,TP302.8
  10. 面向大型商业网站复杂业务的IT资源监控系统的研究与开发,TP277
  11. 被动测量的网络障排除和测试,TP393.06
  12. 主机网络流量与网络行为特征的研究,TP393.06
  13. 基于防火墙和入侵检测的综合主机安全防范系统,TP393.08
  14. 基于零拷贝的数据包捕获与过滤系统的设计与实现,TP393.08
  15. 手机垃圾短信过滤平台的分析与应用,TN929.53
  16. 多输出函数逻辑综合的理论研究与程序实现,TN47
  17. 基于内容的电子邮件过滤系统的研究,TP393.098
  18. 基于Snort的分布式入侵检测系统的研究与应用,TP393.08
  19. 校园网被控主机的检测系统研究,TP393.08
  20. 基于FPGA的正则表达式匹配技术的研究,TN791
  21. 海量遥感影像管理系统的研究与实现,P237

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络安全
© 2012 www.xueweilunwen.com