学位论文 > 优秀研究生学位论文题录展示
基于粗糙集理论的多分类器组合应用研究
作 者: 原永乐
导 师: 冯林
学 校: 四川师范大学
专 业: 计算机软件与理论
关键词: 粗糙集 集成学习 分类 多分类器组合
分类号: TP18
类 型: 硕士论文
年 份: 2012年
下 载: 65次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机技术及通信技术的发展,各行各业产生了大量的数据,为了揭示数据中隐含的规律,数据挖掘技术应运而生。目前,主要的数据挖掘方法有决策树、神经网络、回归分析、遗传算法、粗糙集、聚类等。其中,粗糙集理论以数据的分类能力为基础,在缺乏先验知识的情况下,能够解决潜在的、不确定的或含糊数据中的知识获取问题。它已在模式识别、特征选择、故障诊断等领域取得了成功应用。传统的分类方法常采用一个分类器进行分类,这就要求这一分类器能在所有的数据样本上都有较好的分类能力,这是难以实现的。多分类器集成理论为解决单个分类器分类能力的不足提供了有效方法。但作为机器学习领域的一个重要课题,多分类器集成在粗糙集理论中的应用还没有受到广泛的关注。基于以上背景,本文把粗糙集理论引入多分类器集成,研究了基于粗糙集理论的集成学习方法,主要内容如下:1、对基分类器的构造方法进行了研究。本文根据Rough set理论、C4.5算法、NB算法等三种不同的分类算法对训练数据集随机训练得到三种类型的基分类器,包括粗糙分类器、贝叶斯分类器和决策树分类器。2、对基分类器的差异性构成进行了研究。根据分类器集成理论,基分类器差异性越大,分类器组合的分类效果就越好。本文在两个方面体现了基分类器的差异性:一是基分类器是根据训练数据集随机生成的;二是基分类器采用三种不同类型的算法训练得到。3、提出多分类器集成策略及方法。为了达到最好的集成效果,本文首先训练多个不同类型分类器,并将训练数据集按照决策属性值分为多个子集。再根据K-means方法将测试数据集分为同样多个聚类集,并通过欧式距离找到它们与训练数据子集之间的对应关系。最后选择对训练数据子集分类效果最好的分类器对相应的聚类集进行分类测试。为了验证本文方法的有效性,采用大量UCI数据集进行实验,得到了较好的分类效果。
|
全文目录
摘要 3-5 Abstract 5-9 第一章 绪论 9-15 1.1 研究背景及意义 9-10 1.2 国内外研究现状 10-12 1.3 本文的主要研究内容 12-13 1.4 本文的论文结构 13-15 第二章 多分类器组合方法 15-32 2.1 集成学习 15-19 2.1.1 集成学习的基本概念 15 2.1.2 集成学习的主要方法 15-19 2.2 多分类器组合 19-21 2.2.1 多分类器组合需解决的问题 20 2.2.2 多分类器组合的系统结构 20-21 2.3 基分类器 21-24 2.3.1 基分类器之间的关系 21-22 2.3.2 基分类器的获得方式 22-23 2.3.3 基分类器的整合方法 23-24 2.4 分类器的性能与评价 24-30 2.4.1 分类器的性能度量 24-25 2.4.2 分类器的评价方式 25-28 2.4.3 分类器组合的多样性度量 28-30 2.5 本章小结 30-32 第三章 粗糙集理论及本文粗糙分类器的构造 32-56 3.1 数据挖掘 32-34 3.1.1 数据挖掘的步骤 32-33 3.1.2 数据挖掘的主要功能 33-34 3.2 分类技术 34-40 3.3 粗糙集理论 40-43 3.4 粗糙集约简 43-46 3.4.1 属性约简 43-45 3.4.2 属性值约简 45-46 3.5 本文粗糙分类器的构造 46-54 3.5.1 数据预处理 46-50 3.5.2 属性约简 50-53 3.5.3 值约简 53-54 3.6 本章小结 54-56 第四章 本文多分类器组合方法及实验分析 56-67 4.1 实验数据集 56-58 4.2 基于多数投票的多分类器组合方法 58-60 4.2.1 多分类器组合结构图 58-59 4.2.2 实验结果对比 59-60 4.3 基于聚类的多分类器组合方法 60-65 4.3.1 相关理论基础 60-61 4.3.2 多分类器组合的结构图 61-62 4.3.3 多分类器组合方法思想 62-64 4.3.4 实验结果对比 64-65 4.4 实验结论 65-66 4.5 本章小结 66-67 第五章 总结与展望 67-70 5.1 本文总结 67-68 5.2 进一步工作 68-70 参考文献 70-74 攻读硕士期间所发表的论文 74-75 致谢 75
|
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 计算智能在数字化卷烟叶组配方中的应用研究,TS44
- 基于中国土壤系统分类的土壤类型和界线确定研究,S155
- 基于土壤系统分类的土壤调查方法研究,S155
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 积极情绪对3-5岁幼儿认知灵活性的影响,B844.1
- 太原东山油松人工林数量特征与生物多样性研究,S791.254
- 中国东海可培养微生物多样性研究及多相分类学鉴定,Q93
- 基于支持向量机的故障诊断研究,TH165.3
- 黑龙江省森林火险等级及天气形势预报方法研究,S762
- 某锻造企业综合库设计与开发,TG318
- 基于聚焦爬虫技术的教学资源搜集与自动整理方法研究,TP301.6
- 吉林省蟋蟀总科昆虫分类学研究,Q969.26
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|