学位论文 > 优秀研究生学位论文题录展示
聚类分析在入侵检测中的应用研究
作 者: 张学杰
导 师: 张冬雯
学 校: 河北科技大学
专 业: 计算机应用技术
关键词: 入侵检测 数据挖掘 聚类 集群评估指标 k均值
分类号: TP393.08
类 型: 硕士论文
年 份: 2009年
下 载: 46次
引 用: 1次
阅 读: 论文下载
内容摘要
随着网络安全问题日益突出,传统的安全防护措施(如防火墙等)已经无法保护系统的安全。入侵检测技术作为一种新的安全保障技术,相对于传统的安全保护措施,它不是处于被动激发,而是主动的检测,在网络系统受到危害之前拦截入侵,有效的弥补了传统网络安全防护技术的缺陷,己经成为网络信息安全的一个重要研究领域。但是,海量的计算机系统和网络数据给入侵检测带来了极大的困难。数据挖掘技术的出现提供了解决这一问题的有效手段。数据挖掘可以从海量的数据中提取出有用的信息,将数据挖掘技术与入侵检测技术相结合,增加了入侵检测系统对海量数据的处理能力。数据挖掘中的聚类分析方法是一种典型的无监督学习技术,可以在未标记数据集上直接建立入侵检测模型或者发现异常数据,对于提高入侵检测系统的效率有着重大的研究价值。本文以聚类分析技术为基础,以对聚类分析在入侵检测技术中应用的研究为核心。首先,对入侵检测技术和聚类分析技术进行了研究和分析,探讨了目前聚类算法在入侵检测中的应用情况。其次,对经典的聚类算法k-means进行了深入分析,指出了传统k-means算法的不足(需要事先输入最终的聚类个数k),给出了针对这个不足之处的改进方法,目的是在输入条件只有初始数据集的基础上,得到较好的聚类结果。给出了一种新的集群评估指标Dispersion Measure for Clusters Index (DMC)指标。利用集群评估指标Davies-Bouldin Index(DBI)指标和本文给出的DMC指标,对k-means进行改进,得到了两个k-means改进算法:DBIk-means和DMCk-means算法。详细分析了入侵检测的模型结构,针对入侵检测系统的高误报率的不足,给出了一种入侵检测改进模型,在检测模块和报警模块之间加入了一个聚类检测模块,将改进的算法加入到该模块中,以降低入侵检测系统的误报率。最后,采用KDD CUP99数据集作为源数据集,对k-means以及改进后的算法进行了检测实验,实验结果证明对k-means算法的改进是有效的,将其应用到改进的入侵检测模型中,可以降低系统的误报率,符合改进的目的。
|
全文目录
摘要 5-6 ABSTRACT 6-10 第1章 绪论 10-16 1.1 研究的背景及意义 10-11 1.2 国内外研究现状 11-14 1.2.1 入侵检测国内外研究现状 11-13 1.2.2 聚类的研究进展 13 1.2.3 基于聚类的入侵检测的研究进展 13-14 1.3 本论文研究的主要内容 14-16 1.3.1 研究内容 14 1.3.2 文章结构 14-16 第2章 相关的技术简介 16-34 2.1 入侵检测 16-25 2.1.1 入侵检测的基本概念 16-17 2.1.2 入侵检测通用系统框架 17-18 2.1.3 入侵检测的分类 18-23 2.1.4 目前入侵检测中存在的问题 23-24 2.1.5 入侵检测未来的发展方向 24-25 2.2 聚类分析 25-31 2.2.1 聚类分析的定义 25 2.2.2 聚类算法的要求 25-26 2.2.3 聚类分析中的数据类型 26-29 2.2.4 聚类的分类 29-31 2.3 集群评估指标 31-33 2.4 本章小结 33-34 第3章 改进的K-MEANS 算法 34-43 3.1 K-MEANS 算法 34-35 3.2 K-MEANS 算法的改进思想 35-37 3.3 基于DBI 改进的K-MEANS 算法 37-40 3.3.1 改进的DBIk-means 算法 37-39 3.3.2 DBIk-means 的执行步骤和算法描述 39-40 3.4 基于集群指标DMC 改进的K-MEANS 算法 40-42 3.4.1 DMC 指标 40 3.4.2 改进的DMC k-means 算法 40-41 3.4.3 DMCk-means 算法的执行步骤及过程描述 41-42 3.5 本章小结 42-43 第4章 基于聚类分析的入侵检测系统模型 43-49 4.1 入侵检测的系统模型 43-45 4.1.1 数据采集 43 4.1.2 数据预处理 43-44 4.1.3 检测引擎 44-45 4.1.4 报警模块 45 4.2 基于聚类分析的入侵检测改进模型 45 4.3 聚类检测模块 45-48 4.3.1 训练数据模块 46-47 4.3.2 检测模块 47-48 4.4 本章小结 48-49 第5章 实验及结果分析 49-57 5.1 实验数据集描述 49-50 5.2 实验数据的选取 50-52 5.3 实验结果分析 52-56 5.3.1 对比k-means 算法和DBIk-means 算法 52-55 5.3.2 对比DMCk-means 算法和DBIk-means 算法 55-56 5.4 结果分析 56 5.5 本章小结 56-57 结论 57-59 参考文献 59-62 攻读硕士学位期间所发表的论文 62-63 致谢 63
|
相似论文
- 高灵敏度GNSS软件接收机的同步技术研究与实现,P228.4
- 医学超声图像去噪方法研究,TP391.41
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 图像分割中阴影去除算法的研究,TP391.41
- 基于图分割的文本提取方法研究,TP391.41
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- K-均值聚类算法的研究与改进,TP311.13
- 大学生综合素质测评研究,G645.5
- 基于对数正态分布异方差模型的统计推断,O212.1
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- 南通市农业面源污染负荷研究与综合评价,X592
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络安全
© 2012 www.xueweilunwen.com
|