学位论文 > 优秀研究生学位论文题录展示

基于蚁群的集成学习方法及其并行性研究

作　者: 李健
导　师: 王英林
学　校: 上海交通大学
专　业: 计算机科学与技术
关键词: 蚁群算法集成学习方法药物性预测并行计算
分类号: TP18
类　型: 硕士论文
年　份: 2013年
下　载: 27次
引　用: 0次
阅　读: 论文下载

内容摘要

集成学习方法能够将原本表现一般的弱分类器集成起来,显著地提高学习系统的泛化能力,从而得到更好的预测精度。同时由于集成学习方法具有灵活的适应能力,它已经被成功地应用到各个领域。集成学习是一个较为宽泛的概念,其中包括很多种不同的实现方法,包括：装袋法,Boosting方法以及随机森林等。这些方法在实际的应用中都取得了很好的效果,但是都在还存在着一些缺陷,如Boosting方法不能并行化处理,随机森林在某些噪音较大的分类问题上会过度拟合。为了解决这些问题,不断地有新的集成学习方法被提出。集成学习方法主要分为两个过程,弱分类器生成过程和整合过程。对集成学习方法的研究主要集中在对整合过程的研究。本文中,在对加权整合方法进行了仔细地分析,并发现可以将其考虑成连续优化问题。解决连续优化问题,一般采用启发式算法。启发式算法能够在保证一定精度的情况下,明显地缩短求解时间。蚁群算法是启发式算法中表现很好的一种,已经在组合优化、系统辨识以及数据挖掘领域得到了广泛的应用。但是一般的蚁群算法并不能直接处理连续优化问题。通常的蚁群算法用于处理组合优化问题,处理连续优化问题还需要专门的改进。本文的改进方法主要通过改变信息素的表示形式来实现。将信息素以分布的形式表示,以此来控制权值的连续变化。为了测试最终实现的蚁群集成学习方法,将其应用到了药物预测领域。将其最终的结果与装袋法和Adaboost方法进行比较,得到了比较理想的结果。本文还专门针对蚁群集成学习方法的可并行性进行了研究。随着数据不断地增长,现实中处理的数据量越来越大,算法耗时也逐渐地成为衡量算法性能的一个标准。因此最近不断地将一些经典算法进行并行处理,这说明了并行性研究的必要性。蚁群集成学习方法是在蚁群算法的基础上实现的。在前人的研究中发现,蚁群算法本身具有良好的并行特性。借鉴之前的研究我们发现,蚁群集成学习方法也具有很明显的并行性。在文章的最后还提出了基于MapReduce的并行实现,对比串行处理显著地降低了时间消耗。

全文目录

摘要  5-7
ABSTRACT  7-12
表格索引  12-13
插图索引  13-14
主要符号对照表  14-15
第一章绪论  15-21
  1.1 研究背景及意义  15-17
  1.2 国内外研究现状  17-19
  1.3 本文主要工作  19-21
第二章相关工作  21-31
  2.1 集成学习方法概述  21-22
  2.2 弱分类器的研究  22-25
    2.2.1 决策树的概述  22-25
  2.3 整合方法的研究  25-29
    2.3.1 Bagging算法  26-27
    2.3.2 Boosting算法  27
    2.3.3 随机森林  27-29
  2.4 集成学习方法的多样性  29-30
  2.5 模型好坏的衡量标准  30-31
第三章蚁群集成学习算法(ACO-Ensemble)的提出及实现  31-47
  3.1 蚁群算法概述  31-36
    3.1.1 蚁群算法的原理与机制  32-33
    3.1.2 蚁群算法的基本特点  33-34
    3.1.3 蚁群算法的实现  34-36
  3.2 蚁群算法参数选择原则  36-38
    3.2.1 迭代终止条件  36-37
    3.2.2 信息启发式因子的选择  37
    3.2.3 期望启发式因子的选择  37-38
    3.2.4 信息素残留因子的选择  38
    3.2.5 信息素强度的选择  38
    3.2.6 蚂蚁数目的选择  38
  3.3 蚁群集成学习算法(ACO-Ensemble)  38-47
    3.3.1 蚁群集成学习算法的提出  39-40
    3.3.2 蚁群集成学习算法的特殊性  40-41
    3.3.3 连续蚁群算法的实现  41-47
第四章蚁群集成学习算法在药物预测中的应用  47-61
  4.1 药物预测的背景  47-49
    4.1.1 类药性化合物  47-48
    4.1.2 类药性化合物和非类药性化合物的比较  48-49
  4.2 实验结果及分析  49-59
    4.2.1 数据集的描述  49
    4.2.2 弱分类器的筛选  49-53
    4.2.3 蚁群集成学习方法参数调整  53-58
    4.2.4 集成学习方法比较  58-59
  4.3 本章小结  59-61
第五章蚁群集成学习算法的并行性研究  61-69
  5.1 集成学习并行实现的研究现状  61-62
  5.2 蚁群集成学习算法的并行实现  62-67
    5.2.1 MapReduce简介  62-63
    5.2.2 基本思想  63-67
  5.3 实验结果  67
  5.4 本章小结  67-69
总结与展望  69-73
参考文献  73-79
致谢  79-81
攻读学位期间发表的学术论文目录  81-83
攻读学位期间参与的项目  83

基于蚁群的集成学习方法及其并行性研究

内容摘要

全文目录

相似论文