学位论文 > 优秀研究生学位论文题录展示

基于属性泛化的动态集成学习算法研究

作 者: 吴芳
导 师: 田卫东
学 校: 合肥工业大学
专 业: 计算机系统结构
关键词: 集成学习 动态集成 属性泛化
分类号: TP181
类 型: 硕士论文
年 份: 2012年
下 载: 30次
引 用: 0次
阅 读: 论文下载
 

内容摘要


集成学习是近年机器学习领域的研究热点之一。集成学习的基本思想是,首先通过多个基分类器对问题进行分类,然后利用某种方式对分类结果进行综合,以得到更准确的结果。其中,基分类器间是相互独立的。动态集成技术则是通过动态地选择部分而非全部的分类器参与集成,或者动态调整参与集成的基分类器的权重,以获得更高的分类准确率,是进一步提高集成系统分类性能的重要手段。自然数据中广泛存在层次特征。本文主要研究如何基于数据的层次性特征,来构造高性能的动态集成分类器。本文的主要研究工作如下:(1)针对具有层次性特征的数据集,提出了基于泛化属性值划分方法的集成学习算法GAVPEL。该方法利用属性泛化技术,根据数据的层次结构,将训练集划分成不同层次和粒度的子训练集,并在每个子训练集上生成基分类器;在分类时,根据其条件属性值动态地选择相关的基分类器参与集成,并利用投票方法来综合各基分类器的分类结果。实验表明,该算法比传统的Bagging和AdaBoost算法更加有效。(2)由于属性在不同泛化方式下会产生不同的泛化路径,为此,本文在GAVPEL算法的基础上提出了M2算法。该算法利用可能的多种泛化路径,建立MRML模型,根据该模型进行训练集的划分,并在每个划分的子训练集上建立基分类器;在分类时,选择多条泛化路径上的基分类器同时参加集成,分类结果仍采用投票法进行合成。试验表明,该算法不仅能提高集成系统的分类性能,而且还能提高系统的鲁棒性。

全文目录


摘要  5-6
ABSTRACT  6-7
致谢  7-12
第一章 绪论  12-19
  1.1 本文研究背景与意义  12-13
  1.2 国内外研究现状  13-16
    1.2.1 集成学习  13-15
    1.2.2 动态集成技术  15-16
  1.3 本文主要研究内容  16-17
  1.4 本文组织结构  17-19
第二章 集成学习的基本理论和方法  19-28
  2.1 集成学习的相关概念  19-20
  2.2 集成有效的原因  20-21
  2.3 集成学习的理论分析  21-22
  2.4 集成学习的框架  22-23
    2.4.1 基分类器的训练  22-23
    2.4.2 基分类器的集成策略  23
  2.5 几种主要的集成技术  23-26
    2.5.1 Bagging  23-24
    2.5.2 AdaBoost  24-25
    2.5.3 随机子空间法  25-26
    2.5.4 交叉验证  26
    2.5.5 动态集成技术  26
  2.6 集成学习中存在的问题  26-27
  2.7 本章小结  27-28
第三章 基于属性泛化的动态集成学习算法  28-40
  3.1 引言  28-29
  3.2 基分类器训练集构造的划分策略  29-30
    3.2.1 随机划分  29
    3.2.2 聚类划分  29
    3.2.3 超平面划分  29-30
    3.2.4 先验知识划分  30
    3.2.5 判别分析划分  30
  3.3 利用属性泛化技术的属性值划分方法  30-34
    3.3.1 数据的层次特征  30-31
    3.3.2 属性泛化技术  31-32
    3.3.3 产生泛化的层次属性值  32-33
    3.3.4 属性值划分  33-34
  3.4 基于属性值划分的动态集成学习算法  34-36
    3.4.1 基分类器的训练  34
    3.4.2 基分类器的集成  34-35
    3.4.3 GAVPEL 算法描述  35-36
  3.5 试验结果和分析  36-38
    3.5.1 试验数据  36-37
    3.5.2 试验结果与分析  37-38
  3.6 本章小结  38-40
第四章 基于多重多层次属性泛化的动态集成学习算法  40-49
  4.1 引言  40
  4.2 基于 MRML 属性泛化的并行划分方法  40-43
    4.2.1 多重多层次的泛化模型  40-43
    4.2.2 属性值的并行多路划分  43
  4.3 基于 MRML 属性泛化并行划分的动态集成学习算法  43-45
    4.3.1 基分类器的训练  43-44
    4.3.2 基分类器的集成  44-45
    4.3.3 M2 算法描述与时间性能  45
  4.4 试验结果与分析  45-48
    4.4.1 试验结果  45-47
    4.4.2 结果分析  47-48
  4.5 本章小结  48-49
第五章 总结与展望  49-51
  5.1 本文总结  49
  5.2 未来工作展望  49-51
参考文献  51-56
攻读硕士学位期间参加研究的课题和发表的论文  56-57

相似论文

  1. 多分类器动态集成技术研究及其应用,TP181
  2. 基于数据挖掘算法的蛋白质相互作用及其活性位点研究,TP311.13
  3. 基于基因表达谱的肿瘤分类方法研究,R730.2
  4. 基于多任务的多层次选择性集成学习的研究,TP181
  5. 动态集成中Agent模型的研究与实现,TP311.52
  6. 面向服务流的Agent动态定位与集成,TP393.09
  7. 基于多Agent的动态集成框架的研究与实现,TP311.52
  8. 施工项目目标动态集成管理研究,TU71
  9. 动态集成粗糙集约简,TP18
  10. 可视化数据挖掘在轮胎销售业务中的应用,TP311.13
  11. 基于Ensemble技术的非平衡数据挖掘,TP311.13
  12. 中间层事务性组件的研究及应用,TP311.52
  13. 基于构件复用和XML技术的柔性信息系统开发研究,TP311.52
  14. 基于网络服务的动态集成技术研究,TP393
  15. OGSA/WSRF架构下的企业应用动态集成的研究与应用,TP311.52
  16. 基于Web服务动态集成的移动电子商务软件平台的设计与应用,TP311.52
  17. 基于Web Services的行业中心化动态电子商务研究,TP311.52
  18. 基于支持向量机的集成学习算法研究,O212
  19. 基于多视图集成的多关系分类方法研究,TP311.13
  20. 类别不平衡数据的集成学习研究,TP181
  21. 动态集成的移动电子商务平台的设计与研究,TP399

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com