学位论文 > 优秀研究生学位论文题录展示
基于DOM建模的网页木马检测的分类器设计
作 者: 范宇
导 师: 季丽萍
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 网页木马检测 决策树分类器 WIM-DOM模型 序列特征
分类号: TP309.5
类 型: 硕士论文
年 份: 2010年
下 载: 104次
引 用: 0次
阅 读: 论文下载
内容摘要
随着互联网应用的普及,网页已经成为人们获取和发布信息的最主要的方式之一。大量网站在提供信息的同时,也给用户带来了不少安全隐患。据统计显示,木马已经取代病毒成为目前最主要的威胁,而被感染的木马中有超过90%是通过网页传播。因此,如何有效地防止网页木马的传播,以保证用户在使用各种基于网页的应用中不被恶意代码感染,成为亟待解决的问题之一。不同于传统木马,网页木马传播速度更快、范围更广,威胁更大;另外,网页木马采用脚本编码,更容易被编码、加密,拥有更多的变种。因此,传统木马的检测模型并不适用于网页木马检测。然而现有的网页木马检测技术中,仍以广泛应用于传统木马检测的静态特征匹配技术为主,它对未知样本的处理滞后;并且,随着木马库的迅速增长,匹配效率会越来越低。因此我们需要一种针对网页本身的高效检测技术,在木马通过网页入侵主机之前,将威胁阻止。针对以上问题,课题首先对网页木马的攻击原理进行了深入分析,总结出网页木马攻击的特点和检测难点;然后研究了网页的DOM结构,以及浏览器对网页的解析过程,在此基础上提出一种基于DOM结构的网页代码审查模型WIM-DOM;最后,在WIM-DOM建模基础上,构建了基于决策树的网页木马分类器。本文的主要研究工作和创新点如下:(1)研究了网页木马的攻击原理和网页的DOM结构、解析原理,总结出网页木马攻击的特性及其在DOM元素属性和解构上的表现方式。(2)提出了一种基于DOM结构的网页代码审查模型WIM-DOM。该模型针对网页木马攻击的隐蔽性和局部性特点,利用DOM结构将网页源文件映射成为DOM元素序列。该模型既增强了DOM元素属性特征,又保留了元素间的层次结构,有利于局部特征在网页木马检测中发挥作用,为分类器的设计打下基础。(3)在WIM-DOM建模基础上,设计了两种基于决策树的网页木马分类器。分类器WIM-DOM(I)首次提出以DOM元素的属性信息作为分类特征。WIM-DOM(II)首次基于网页木马攻击的序列模式提取DOM元素的序列特征,以提高分类器对于具有多步骤攻击行为的网页木马的检测率,并利用统计信息降低网页自身差异对分类的影响。(4)设计分类实验,从准确性和效率两个方面验证了WIM-DOM分类器的优势。
|
全文目录
摘要 5-6 ABSTRACT 6-11 第1章 绪论 11-16 1.1 课题背景和意义 11-12 1.2 国内外研究现状与分析 12-14 1.2.1 传统的木马检测技术 12-13 1.2.2 网页木马检测技术 13-14 1.2.3 现有网页木马检测产品 14 1.3 本文的主要研究内容及组织结构 14-16 第2章 网页木马检测相关技术 16-27 2.1 木马的衍变及其特征 16-17 2.2 网页木马攻击原理及其检测难点 17-21 2.2.1 网页木马的攻击过程 17-18 2.2.2 常见的网页木马表现形式 18-19 2.2.3 网页木马的检测方法及趋势 19-21 2.2.4 网页木马检测的难点 21 2.3 网页DOM结构及其解析 21-24 2.3.1 网页的DOM结构 21-23 2.3.2 浏览器对网页的解释过程 23-24 2.3.3 Javascript脚本解释引擎 24 2.4 智能化检测算法 24-26 2.4.1 分类算法 25-26 2.4.2 模式匹配算法 26 2.5 本章小结 26-27 第3章 基于DOM的网页审查模型WIM-DOM 27-42 3.1 引言 27 3.2 WIM-DOM模型的设计思想 27-32 3.2.1 脚本代码审查 28-29 3.2.2 DOM树的重构 29 3.2.3 基于元模板的事件提取 29-32 3.3 WIM-DOM建模 32-35 3.3.1 WIM-DOM建模概述 32-33 3.3.2 WIM-DOM树构建算法 33-35 3.3.3 WIM-DOM事件提取算法 35 3.4 模型分析 35-41 3.4.1 WIM-DOM模型边界 35-38 3.4.2 WIM-DOM建模优势 38-41 3.5 本章小结 41-42 第4章 基于WIM-DOM的分类器设计及优化 42-58 4.1 引言 42 4.2 训练数据集的设计 42-44 4.2.1 随机构建训练正例集 43 4.2.2 合成训练负例集 43-44 4.3 分类特征的设计 44-48 4.3.1 网页木马特征分析 44-46 4.3.2 基于WIM-DOM的属性特征提取方法 46-48 4.4 WIM-DOM(I):基于决策树算法的分类器设计 48-51 4.4.1 分类算法及属性度量选择 48-50 4.4.2 WIM-DOM(I)分类器框架设计 50-51 4.5 WIM-DOM(II): 融合序列特征的分类器优化 51-56 4.5.1 序列模式的识别 51-52 4.5.2 序列特征提取方法 52-54 4.5.3 统计特征的提取方法 54-55 4.5.4 WIM-DOM(II)分类器框架设计 55-56 4.6 本章小结 56-58 第5章 仿真实验与分析 58-67 5.1 引言 58 5.2 实验环境 58-60 5.2.1 机器配置 58 5.2.2 样本来源 58-60 5.2.3 实验工具Weka 60 5.3 分类准确性测试结果及分析 60-64 5.3.1 评价指标的定义 60 5.3.2 分类准确度的对比测试 60-62 5.3.3 序列特征对分类效果的影响 62-63 5.3.4 统计特征对分类效果的影响 63 5.3.5 分类实验分析 63-64 5.4 性能测试结果 64-66 5.4.1 WIM-DOM建模速度 64 5.4.2 分类器效率对比测试 64-66 5.5 本章小结 66-67 结论 67-68 参考文献 68-72 攻读硕士学位期间发表的论文 72-74 致谢 74
|
相似论文
- 基因组可变剪接特征分析与预测,TP311.13
- 基于多特征融合的乳腺癌相关基因预测方法研究,R737.9
- 基于混沌理论的汽轮机组振动状态监测与预测研究,TK267
- 猪MMP-2和TIMP-2基因特征与功能分析,S828
- 山羊毛色稀释位点候选基因RAB27A基因研究,S827
- 山羊毛色稀释位点候选基因MLPH研究,S827
- 水文时间序列趋势分析的研究与应用,TP311.13
- 空间飞行诱发水稻基因组不稳定序列特征分析,S511
- 基于氨基酸使用偏好及基因功能信息预测疾病相关基因,Q75
- 山羊LF基因序列分析及SNPs研究,S827
- 黑麂(Muntiacus crinifrons)AFLP-SCAR种特异性探针研制,S865
- 分级防火墙系统中动态访问控制技术研究,TP393.08
- 基于LINUX的交通监测系统的研究与开发,TP316.81
- 配电网智能型线路故障测距的研究,TM76
- 经营系统中的时间序列分析,TP399
- 一类新型钟控序列的构造与分析,O157.4
- 基于序列统计特征的水平转移基因搜索,Q78
- 基于内容敏感图像过滤关键技术研究及应用,TP391.41
- 数据挖掘技术在SCADA告警信息分析中的应用研究,TM762
- 决策树分类器在《厚普销售管理系统》中的应用,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 安全保密 > 计算机病毒与防治
© 2012 www.xueweilunwen.com
|