学位论文 > 优秀研究生学位论文题录展示

集成学习及其应用研究

作 者: 张新东
导 师: 亢俊健;李文斌
学 校: 石家庄经济学院
专 业: 计算机应用技术
关键词: 集成学习 信息增益 遗传算法 入侵检测
分类号: TP181
类 型: 硕士论文
年 份: 2010年
下 载: 71次
引 用: 0次
阅 读: 论文下载
 

内容摘要


集成学习(Ensemble Learning)是一种机器学习范式,是当前的研究热点之一在多个领域有了很好的应用。但集成学习技术还没有成熟,在研究过程中仍然存在着众多待解决的问题,在应用上也和人们期待的水平相去甚远。本课题对集成学习进行了深入地研究,一方面分析了现有方法的优劣。另一方面,研究了影响集成效果的各个因素,这为进一步改进集成学习做好铺垫。在现有算法的研究基础上,提出了新的集成学习方法:针对某些个体分类器对集成效果起较小的作用或起消极作用的情况,本文提出了“基于信息增益的分类器选择”方法,这种方法首先需要构造分类器空间,然后计算个体分类器信息增益,根据信息增益删除一个或若干个个体分类器,最后再将剩余的分类器集成,实验结果表明经过信息增益选择分类器后的集成要优于不进行处理的情况;针对数据集中不是所有的特征都对集成起积极作用的情况,本文提出了“基于改进遗传算法的特征选择”方法,该方法将机器学习应用到遗传算法中,达到有效选择特征的目的,然后在处理过的数据集上使用集成学习,实验证明经过此方法处理的数据集不但在集成效果有了很大提高,而且大大缩短训练时间。最后,本文还对集成学习的应用进行了研究,第一,详细分析了入侵检测数据集(KDD CUP99、UCI)。第二,对KDD CUP 99做了适当的处理,然后成功将集成学习方法应用到此数据集上。第三,比较了经典的集成学习方法和本文提出的集成学习方法在入侵检测数据集上的效果。本文通过多次实验和应用实例对提出的新方法进行了验证,结果表明新方法是有效性的、可行性的。

全文目录


摘要  5-6
ABSTRACT  6-9
1. 前言  9-13
  1.1 集成学习的研究背景及意义  9
  1.2 集成学习发展状况及应用  9-11
    1.2.1 发展现状  9-10
    1.2.2 应用研究  10-11
  1.3 主要研究内容和组织结构  11-13
    1.3.1 论文的主要研究内容  11
    1.3.2 论文的组织结构  11-13
2. 集成学习方法的研究与分析  13-31
  2.1 个体分类器获得方式  13-16
    2.1.1 训练数据的处理  14-15
    2.1.2 输入特征的处理  15-16
  2.2 个体分类器集成  16-21
    2.2.1 决策层次的融合  16-18
    2.2.2 排序层次的融合  18-19
    2.2.3 度量层次的融合  19-21
  2.3 集成学习方法的比较  21-29
    2.3.1 集成方法介绍  22-25
    2.3.2 实验数据  25-26
    2.3.3 实验设计  26-27
    2.3.4 实验结果  27-29
  2.4 本章小结  29-31
3. 基于IG的分类器选择  31-41
  3.1 信息增益  31-32
    3.1.1 熵的概念  31
    3.1.2 信息增益  31-32
  3.2 基于信息增益的分类器选择公式  32-33
  3.3 算法分析  33-34
  3.4 算法实现  34-39
    3.4.1 实验数据  34
    3.4.2 实验流程  34-35
    3.4.3 实验设计  35
    3.4.4 实验结果  35-39
  3.5 本章小结  39-41
4. 基于改进遗传算法的特征选择  41-49
  4.1 遗传算法简述  41-43
    4.1.1 编码  41
    4.1.2 初始种群  41-42
    4.1.3 适应度函数  42-43
    4.1.4 遗传算子  43
  4.2 算法描述  43-44
  4.3 算法实现  44-46
    4.3.1 算法流程  44-45
    4.3.2 实验结果  45-46
  4.4 结果验证  46-47
  4.5 本章小结  47-49
5. 集成学习在入侵检测上应用  49-55
  5.1 入侵检测及KDD CUP 99  49-51
    5.1.1 入侵检测概述  49
    5.1.2 KDD CUP 99介绍  49-51
  5.2 应用分析  51-53
    5.2.1 数据处理  51
    5.2.2 特征选择  51-52
    5.2.3 分类器选择  52-53
    5.2.4 结果分析  53
  5.3 本章小结  53-55
6. 总结与展望  55-57
  6.1 总结  55-56
  6.2 展望  56-57
参考文献  57-61
致谢  61

相似论文

  1. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  2. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  3. 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
  4. 部队人员网上训练与考核系统的开发,TP311.52
  5. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  6. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  7. 基于遗传算法的中短波磁天线的设计及实现,TN820
  8. 基于遗传算法的柑橘图像分割,TP391.41
  9. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  10. 基于遗传—牛顿算法的公交优化调度,TP18
  11. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  12. 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41
  13. 基于遗传算法和粗糙集的聚类算法研究,TP18
  14. 基于行为可信的无线传感器网络入侵检测技术的研究,TP212.9
  15. 基于遗传算法的淠史杭灌区渠系配水优化编组模型的研究,S274
  16. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  17. 遗传算法在物流仓储优化中的应用研究,F259.2
  18. 基于遗传算法的矿山资源优化调度模型的研究,O224
  19. 磁流变阻尼器的力学特性及其在火炮反后坐中的应用研究,TB535.1
  20. 基于机器学习的入侵检测系统研究,TP393.08
  21. 模糊预测函数控制改进算法的研究及应用,TP273

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com