学位论文 > 优秀研究生学位论文题录展示
基于属性泛化的动态集成学习算法研究
作 者: 吴芳
导 师: 田卫东
学 校: 合肥工业大学
专 业: 计算机系统结构
关键词: 集成学习 动态集成 属性泛化
分类号: TP181
类 型: 硕士论文
年 份: 2012年
下 载: 30次
引 用: 0次
阅 读: 论文下载
内容摘要
集成学习是近年机器学习领域的研究热点之一。集成学习的基本思想是,首先通过多个基分类器对问题进行分类,然后利用某种方式对分类结果进行综合,以得到更准确的结果。其中,基分类器间是相互独立的。动态集成技术则是通过动态地选择部分而非全部的分类器参与集成,或者动态调整参与集成的基分类器的权重,以获得更高的分类准确率,是进一步提高集成系统分类性能的重要手段。自然数据中广泛存在层次特征。本文主要研究如何基于数据的层次性特征,来构造高性能的动态集成分类器。本文的主要研究工作如下:(1)针对具有层次性特征的数据集,提出了基于泛化属性值划分方法的集成学习算法GAVPEL。该方法利用属性泛化技术,根据数据的层次结构,将训练集划分成不同层次和粒度的子训练集,并在每个子训练集上生成基分类器;在分类时,根据其条件属性值动态地选择相关的基分类器参与集成,并利用投票方法来综合各基分类器的分类结果。实验表明,该算法比传统的Bagging和AdaBoost算法更加有效。(2)由于属性在不同泛化方式下会产生不同的泛化路径,为此,本文在GAVPEL算法的基础上提出了M2算法。该算法利用可能的多种泛化路径,建立MRML模型,根据该模型进行训练集的划分,并在每个划分的子训练集上建立基分类器;在分类时,选择多条泛化路径上的基分类器同时参加集成,分类结果仍采用投票法进行合成。试验表明,该算法不仅能提高集成系统的分类性能,而且还能提高系统的鲁棒性。
|
全文目录
摘要 5-6 ABSTRACT 6-7 致谢 7-12 第一章 绪论 12-19 1.1 本文研究背景与意义 12-13 1.2 国内外研究现状 13-16 1.2.1 集成学习 13-15 1.2.2 动态集成技术 15-16 1.3 本文主要研究内容 16-17 1.4 本文组织结构 17-19 第二章 集成学习的基本理论和方法 19-28 2.1 集成学习的相关概念 19-20 2.2 集成有效的原因 20-21 2.3 集成学习的理论分析 21-22 2.4 集成学习的框架 22-23 2.4.1 基分类器的训练 22-23 2.4.2 基分类器的集成策略 23 2.5 几种主要的集成技术 23-26 2.5.1 Bagging 23-24 2.5.2 AdaBoost 24-25 2.5.3 随机子空间法 25-26 2.5.4 交叉验证 26 2.5.5 动态集成技术 26 2.6 集成学习中存在的问题 26-27 2.7 本章小结 27-28 第三章 基于属性泛化的动态集成学习算法 28-40 3.1 引言 28-29 3.2 基分类器训练集构造的划分策略 29-30 3.2.1 随机划分 29 3.2.2 聚类划分 29 3.2.3 超平面划分 29-30 3.2.4 先验知识划分 30 3.2.5 判别分析划分 30 3.3 利用属性泛化技术的属性值划分方法 30-34 3.3.1 数据的层次特征 30-31 3.3.2 属性泛化技术 31-32 3.3.3 产生泛化的层次属性值 32-33 3.3.4 属性值划分 33-34 3.4 基于属性值划分的动态集成学习算法 34-36 3.4.1 基分类器的训练 34 3.4.2 基分类器的集成 34-35 3.4.3 GAVPEL 算法描述 35-36 3.5 试验结果和分析 36-38 3.5.1 试验数据 36-37 3.5.2 试验结果与分析 37-38 3.6 本章小结 38-40 第四章 基于多重多层次属性泛化的动态集成学习算法 40-49 4.1 引言 40 4.2 基于 MRML 属性泛化的并行划分方法 40-43 4.2.1 多重多层次的泛化模型 40-43 4.2.2 属性值的并行多路划分 43 4.3 基于 MRML 属性泛化并行划分的动态集成学习算法 43-45 4.3.1 基分类器的训练 43-44 4.3.2 基分类器的集成 44-45 4.3.3 M2 算法描述与时间性能 45 4.4 试验结果与分析 45-48 4.4.1 试验结果 45-47 4.4.2 结果分析 47-48 4.5 本章小结 48-49 第五章 总结与展望 49-51 5.1 本文总结 49 5.2 未来工作展望 49-51 参考文献 51-56 攻读硕士学位期间参加研究的课题和发表的论文 56-57
|
相似论文
- 多分类器动态集成技术研究及其应用,TP181
- 基于数据挖掘算法的蛋白质相互作用及其活性位点研究,TP311.13
- 基于基因表达谱的肿瘤分类方法研究,R730.2
- 基于多任务的多层次选择性集成学习的研究,TP181
- 动态集成中Agent模型的研究与实现,TP311.52
- 面向服务流的Agent动态定位与集成,TP393.09
- 基于多Agent的动态集成框架的研究与实现,TP311.52
- 施工项目目标动态集成管理研究,TU71
- 动态集成粗糙集约简,TP18
- 可视化数据挖掘在轮胎销售业务中的应用,TP311.13
- 基于Ensemble技术的非平衡数据挖掘,TP311.13
- 中间层事务性组件的研究及应用,TP311.52
- 基于构件复用和XML技术的柔性信息系统开发研究,TP311.52
- 基于网络服务的动态集成技术研究,TP393
- OGSA/WSRF架构下的企业应用动态集成的研究与应用,TP311.52
- 基于Web服务动态集成的移动电子商务软件平台的设计与应用,TP311.52
- 基于Web Services的行业中心化动态电子商务研究,TP311.52
- 基于支持向量机的集成学习算法研究,O212
- 基于多视图集成的多关系分类方法研究,TP311.13
- 类别不平衡数据的集成学习研究,TP181
- 动态集成的移动电子商务平台的设计与研究,TP399
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|