学位论文 > 优秀研究生学位论文题录展示

基于DOM建模的网页木马检测的分类器设计

作 者: 范宇
导 师: 季丽萍
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 网页木马检测 决策树分类器 WIM-DOM模型 序列特征
分类号: TP309.5
类 型: 硕士论文
年 份: 2010年
下 载: 104次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网应用的普及,网页已经成为人们获取和发布信息的最主要的方式之一。大量网站在提供信息的同时,也给用户带来了不少安全隐患。据统计显示,木马已经取代病毒成为目前最主要的威胁,而被感染的木马中有超过90%是通过网页传播。因此,如何有效地防止网页木马的传播,以保证用户在使用各种基于网页的应用中不被恶意代码感染,成为亟待解决的问题之一。不同于传统木马,网页木马传播速度更快、范围更广,威胁更大;另外,网页木马采用脚本编码,更容易被编码、加密,拥有更多的变种。因此,传统木马的检测模型并不适用于网页木马检测。然而现有的网页木马检测技术中,仍以广泛应用于传统木马检测的静态特征匹配技术为主,它对未知样本的处理滞后;并且,随着木马库的迅速增长,匹配效率会越来越低。因此我们需要一种针对网页本身的高效检测技术,在木马通过网页入侵主机之前,将威胁阻止。针对以上问题,课题首先对网页木马的攻击原理进行了深入分析,总结出网页木马攻击的特点和检测难点;然后研究了网页的DOM结构,以及浏览器对网页的解析过程,在此基础上提出一种基于DOM结构的网页代码审查模型WIM-DOM;最后,在WIM-DOM建模基础上,构建了基于决策树的网页木马分类器。本文的主要研究工作和创新点如下:(1)研究了网页木马的攻击原理和网页的DOM结构、解析原理,总结出网页木马攻击的特性及其在DOM元素属性和解构上的表现方式。(2)提出了一种基于DOM结构的网页代码审查模型WIM-DOM。该模型针对网页木马攻击的隐蔽性和局部性特点,利用DOM结构将网页源文件映射成为DOM元素序列。该模型既增强了DOM元素属性特征,又保留了元素间的层次结构,有利于局部特征在网页木马检测中发挥作用,为分类器的设计打下基础。(3)在WIM-DOM建模基础上,设计了两种基于决策树的网页木马分类器。分类器WIM-DOM(I)首次提出以DOM元素的属性信息作为分类特征。WIM-DOM(II)首次基于网页木马攻击的序列模式提取DOM元素的序列特征,以提高分类器对于具有多步骤攻击行为的网页木马的检测率,并利用统计信息降低网页自身差异对分类的影响。(4)设计分类实验,从准确性和效率两个方面验证了WIM-DOM分类器的优势。

全文目录


摘要  5-6
ABSTRACT  6-11
第1章 绪论  11-16
  1.1 课题背景和意义  11-12
  1.2 国内外研究现状与分析  12-14
    1.2.1 传统的木马检测技术  12-13
    1.2.2 网页木马检测技术  13-14
    1.2.3 现有网页木马检测产品  14
  1.3 本文的主要研究内容及组织结构  14-16
第2章 网页木马检测相关技术  16-27
  2.1 木马的衍变及其特征  16-17
  2.2 网页木马攻击原理及其检测难点  17-21
    2.2.1 网页木马的攻击过程  17-18
    2.2.2 常见的网页木马表现形式  18-19
    2.2.3 网页木马的检测方法及趋势  19-21
    2.2.4 网页木马检测的难点  21
  2.3 网页DOM结构及其解析  21-24
    2.3.1 网页的DOM结构  21-23
    2.3.2 浏览器对网页的解释过程  23-24
    2.3.3 Javascript脚本解释引擎  24
  2.4 智能化检测算法  24-26
    2.4.1 分类算法  25-26
    2.4.2 模式匹配算法  26
  2.5 本章小结  26-27
第3章 基于DOM的网页审查模型WIM-DOM  27-42
  3.1 引言  27
  3.2 WIM-DOM模型的设计思想  27-32
    3.2.1 脚本代码审查  28-29
    3.2.2 DOM树的重构  29
    3.2.3 基于元模板的事件提取  29-32
  3.3 WIM-DOM建模  32-35
    3.3.1 WIM-DOM建模概述  32-33
    3.3.2 WIM-DOM树构建算法  33-35
    3.3.3 WIM-DOM事件提取算法  35
  3.4 模型分析  35-41
    3.4.1 WIM-DOM模型边界  35-38
    3.4.2 WIM-DOM建模优势  38-41
  3.5 本章小结  41-42
第4章 基于WIM-DOM的分类器设计及优化  42-58
  4.1 引言  42
  4.2 训练数据集的设计  42-44
    4.2.1 随机构建训练正例集  43
    4.2.2 合成训练负例集  43-44
  4.3 分类特征的设计  44-48
    4.3.1 网页木马特征分析  44-46
    4.3.2 基于WIM-DOM的属性特征提取方法  46-48
  4.4 WIM-DOM(I):基于决策树算法的分类器设计  48-51
    4.4.1 分类算法及属性度量选择  48-50
    4.4.2 WIM-DOM(I)分类器框架设计  50-51
  4.5 WIM-DOM(II): 融合序列特征的分类器优化  51-56
    4.5.1 序列模式的识别  51-52
    4.5.2 序列特征提取方法  52-54
    4.5.3 统计特征的提取方法  54-55
    4.5.4 WIM-DOM(II)分类器框架设计  55-56
  4.6 本章小结  56-58
第5章 仿真实验与分析  58-67
  5.1 引言  58
  5.2 实验环境  58-60
    5.2.1 机器配置  58
    5.2.2 样本来源  58-60
    5.2.3 实验工具Weka  60
  5.3 分类准确性测试结果及分析  60-64
    5.3.1 评价指标的定义  60
    5.3.2 分类准确度的对比测试  60-62
    5.3.3 序列特征对分类效果的影响  62-63
    5.3.4 统计特征对分类效果的影响  63
    5.3.5 分类实验分析  63-64
  5.4 性能测试结果  64-66
    5.4.1 WIM-DOM建模速度  64
    5.4.2 分类器效率对比测试  64-66
  5.5 本章小结  66-67
结论  67-68
参考文献  68-72
攻读硕士学位期间发表的论文  72-74
致谢  74

相似论文

  1. 基因组可变剪接特征分析与预测,TP311.13
  2. 基于多特征融合的乳腺癌相关基因预测方法研究,R737.9
  3. 基于混沌理论的汽轮机组振动状态监测与预测研究,TK267
  4. 猪MMP-2和TIMP-2基因特征与功能分析,S828
  5. 山羊毛色稀释位点候选基因RAB27A基因研究,S827
  6. 山羊毛色稀释位点候选基因MLPH研究,S827
  7. 水文时间序列趋势分析的研究与应用,TP311.13
  8. 空间飞行诱发水稻基因组不稳定序列特征分析,S511
  9. 基于氨基酸使用偏好及基因功能信息预测疾病相关基因,Q75
  10. 山羊LF基因序列分析及SNPs研究,S827
  11. 黑麂(Muntiacus crinifrons)AFLP-SCAR种特异性探针研制,S865
  12. 分级防火墙系统中动态访问控制技术研究,TP393.08
  13. 基于LINUX的交通监测系统的研究与开发,TP316.81
  14. 配电网智能型线路故障测距的研究,TM76
  15. 经营系统中的时间序列分析,TP399
  16. 一类新型钟控序列的构造与分析,O157.4
  17. 基于序列统计特征的水平转移基因搜索,Q78
  18. 基于内容敏感图像过滤关键技术研究及应用,TP391.41
  19. 数据挖掘技术在SCADA告警信息分析中的应用研究,TM762
  20. 决策树分类器在《厚普销售管理系统》中的应用,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 安全保密 > 计算机病毒与防治
© 2012 www.xueweilunwen.com