学位论文 > 优秀研究生学位论文题录展示

基于蚁群的集成学习方法及其并行性研究

作 者: 李健
导 师: 王英林
学 校: 上海交通大学
专 业: 计算机科学与技术
关键词: 蚁群算法 集成学习方法 药物性预测 并行计算
分类号: TP18
类 型: 硕士论文
年 份: 2013年
下 载: 27次
引 用: 0次
阅 读: 论文下载
 

内容摘要


集成学习方法能够将原本表现一般的弱分类器集成起来,显著地提高学习系统的泛化能力,从而得到更好的预测精度。同时由于集成学习方法具有灵活的适应能力,它已经被成功地应用到各个领域。集成学习是一个较为宽泛的概念,其中包括很多种不同的实现方法,包括:装袋法,Boosting方法以及随机森林等。这些方法在实际的应用中都取得了很好的效果,但是都在还存在着一些缺陷,如Boosting方法不能并行化处理,随机森林在某些噪音较大的分类问题上会过度拟合。为了解决这些问题,不断地有新的集成学习方法被提出。集成学习方法主要分为两个过程,弱分类器生成过程和整合过程。对集成学习方法的研究主要集中在对整合过程的研究。本文中,在对加权整合方法进行了仔细地分析,并发现可以将其考虑成连续优化问题。解决连续优化问题,一般采用启发式算法。启发式算法能够在保证一定精度的情况下,明显地缩短求解时间。蚁群算法是启发式算法中表现很好的一种,已经在组合优化、系统辨识以及数据挖掘领域得到了广泛的应用。但是一般的蚁群算法并不能直接处理连续优化问题。通常的蚁群算法用于处理组合优化问题,处理连续优化问题还需要专门的改进。本文的改进方法主要通过改变信息素的表示形式来实现。将信息素以分布的形式表示,以此来控制权值的连续变化。为了测试最终实现的蚁群集成学习方法,将其应用到了药物预测领域。将其最终的结果与装袋法和Adaboost方法进行比较,得到了比较理想的结果。本文还专门针对蚁群集成学习方法的可并行性进行了研究。随着数据不断地增长,现实中处理的数据量越来越大,算法耗时也逐渐地成为衡量算法性能的一个标准。因此最近不断地将一些经典算法进行并行处理,这说明了并行性研究的必要性。蚁群集成学习方法是在蚁群算法的基础上实现的。在前人的研究中发现,蚁群算法本身具有良好的并行特性。借鉴之前的研究我们发现,蚁群集成学习方法也具有很明显的并行性。在文章的最后还提出了基于MapReduce的并行实现,对比串行处理显著地降低了时间消耗。

全文目录


摘要  5-7
ABSTRACT  7-12
表格索引  12-13
插图索引  13-14
主要符号对照表  14-15
第一章 绪论  15-21
  1.1 研究背景及意义  15-17
  1.2 国内外研究现状  17-19
  1.3 本文主要工作  19-21
第二章 相关工作  21-31
  2.1 集成学习方法概述  21-22
  2.2 弱分类器的研究  22-25
    2.2.1 决策树的概述  22-25
  2.3 整合方法的研究  25-29
    2.3.1 Bagging算法  26-27
    2.3.2 Boosting算法  27
    2.3.3 随机森林  27-29
  2.4 集成学习方法的多样性  29-30
  2.5 模型好坏的衡量标准  30-31
第三章 蚁群集成学习算法(ACO-Ensemble)的提出及实现  31-47
  3.1 蚁群算法概述  31-36
    3.1.1 蚁群算法的原理与机制  32-33
    3.1.2 蚁群算法的基本特点  33-34
    3.1.3 蚁群算法的实现  34-36
  3.2 蚁群算法参数选择原则  36-38
    3.2.1 迭代终止条件  36-37
    3.2.2 信息启发式因子的选择  37
    3.2.3 期望启发式因子的选择  37-38
    3.2.4 信息素残留因子的选择  38
    3.2.5 信息素强度的选择  38
    3.2.6 蚂蚁数目的选择  38
  3.3 蚁群集成学习算法(ACO-Ensemble)  38-47
    3.3.1 蚁群集成学习算法的提出  39-40
    3.3.2 蚁群集成学习算法的特殊性  40-41
    3.3.3 连续蚁群算法的实现  41-47
第四章 蚁群集成学习算法在药物预测中的应用  47-61
  4.1 药物预测的背景  47-49
    4.1.1 类药性化合物  47-48
    4.1.2 类药性化合物和非类药性化合物的比较  48-49
  4.2 实验结果及分析  49-59
    4.2.1 数据集的描述  49
    4.2.2 弱分类器的筛选  49-53
    4.2.3 蚁群集成学习方法参数调整  53-58
    4.2.4 集成学习方法比较  58-59
  4.3 本章小结  59-61
第五章 蚁群集成学习算法的并行性研究  61-69
  5.1 集成学习并行实现的研究现状  61-62
  5.2 蚁群集成学习算法的并行实现  62-67
    5.2.1 MapReduce简介  62-63
    5.2.2 基本思想  63-67
  5.3 实验结果  67
  5.4 本章小结  67-69
总结与展望  69-73
参考文献  73-79
致谢  79-81
攻读学位期间发表的学术论文目录  81-83
攻读学位期间参与的项目  83

相似论文

  1. 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
  2. 基于蚁群算法的电梯群优化控制研究,TU857
  3. 动态环境下移动对象导航系统相关技术的研究,TP301.6
  4. 基于改进蚁群算法的机器人路径规划研究,TP242
  5. 改进的蚁群算法及其在TSP上的应用研究,TP301.6
  6. 基于免疫机制蚁群算法的电力系统无功优化研究,TP18
  7. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  8. 基于GPU加速FDTD计算速度的研究与仿真,TN011
  9. 基于ACO的自组网QoS组播路由算法研究,TN929.5
  10. 改进蚁群算法在盲均衡中的应用,TN911.5
  11. 基于蚁群算法的移动商务个性化推荐体系研究,TP391.3
  12. 云计算环境下的容错并行Skyline查询技术研究,TP311.13
  13. 预应力换热器管板的数值模拟和研究,TQ051.5
  14. 基于CUDA的图像数字水印技术的研究,TP309.7
  15. 基于贝叶斯网络与蚁群算法的输电线路巡检计划制定与路径规划研究,TM755
  16. 基于层次聚类法和蚁群算法的电力系统无功优化,TM714.3
  17. 基于时间petri网的选矿厂厂址选择研究,TD928.1
  18. 基于关键链的敏捷造船资源配置与缓冲模型研究,F224
  19. 基于线性规划模型和蚁群算法的智能排课系统,TP391.6
  20. 面向大规模空间数据的空间计算模式研究与实现,P208
  21. 航空瞬变电磁法2.5维正演模拟研究,P631.325

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com