学位论文 > 优秀研究生学位论文题录展示
分类中基于粗糙集理论的决策树算法研究
作 者: 秦燕芬
导 师: 何海涛
学 校: 燕山大学
专 业: 计算机软件与理论
关键词: 决策树 离散化 属性约简 差别矩阵 协同进化 二进制编码
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 46次
引 用: 0次
阅 读: 论文下载
内容摘要
决策树方法是一种广泛使用的用于分类的方法,它通过一组无次序,无规则的实例推理出决策树表示形式的分类规则,从而找到一些有价值的、潜在的信息。本文通过对数据集和决策树算法的处理和改进来提高预测分类精度和降低时间复杂度。首先,对连续属性离散化算法进行了比较,提出了一种序列区间拆分算法(SISA),该算法先根据决策属性值相同而条件属性值不同划分成不同的区间,然后再将候选断点插入到这些区间,最后在区间范围内的值用不同的离散值表示出来,通过实例可以得出该算法处理过程简单并易于实现。其次,为了除去分类数据中冗余的属性,本文提出了一种基于简化差别矩阵的属性约简算法(SDMAR)。该算法在属性约简之前,先对数据进行了化简,得到简化决策表。根据简化决策表构造差别矩阵,通过计算差别矩阵中属性出现次数达到对决策表属性约简的目的。通过算法及实例分析得到属性约简过程的时间复杂度有所减小。最后,本文提出了一种基于协同进化的决策树分类算法,引入了遗传学中的二进制编码,这样使得交叉、变异等操作便于实现;用一种新的方法去计算适应度。训练数据集二进制编码后,根据特征划分成不同的子集,每个子集分别使用协同进化方法,协同进化过程一直进行下去,直到找到满意的决策树。本文使用C语言对上述算法进行实现,实验表明,本文所提出的算法在解决各自的问题上是有效的,在时间上低于同类算法,预测精度上得到了提高,实现了预期的研究目标。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-20 1.1 研究的背景及意义 10-11 1.2 国内外研究现状 11-17 1.2.1 离散化方法的研究现状 11-13 1.2.2 属性约简方法的研究现状 13-15 1.2.3 决策树的研究现状 15-17 1.3 存在的主要问题 17-18 1.4 课题的主要研究内容 18 1.5 本文的结构安排 18-20 第2章 分类算法中连续属性离散化方法 20-31 2.1 引言 20-21 2.2 问题的定义与描述 21 2.3 连续属性离散化算法分析比较 21-27 2.3.1 离散化算法优劣的评价标准 22 2.3.2 单变量连续属性离散化 22-25 2.3.3 多变量连续属性离散化 25-27 2.4 基于序列区间的连续属性离散化算法 27-30 2.4.1 SISA 算法描述 27-28 2.4.2 实例分析 28-30 2.5 本章小结 30-31 第3章 分类算法中基于差别矩阵的属性约简方法 31-42 3.1 引言 31-32 3.2 问题的定义与描述 32-36 3.2.1 问题的提出 32-34 3.2.2 问题的定义与描述 34-36 3.3 基于决策表的数据简化 36-37 3.3.1 DS 算法描述 36-37 3.3.2 DS 算法分析 37 3.4 基于差别矩阵的属性约简 37-39 3.4.1 SDMAR 算法描述 38 3.4.2 SDMAR 算法效率分析 38-39 3.5 实例分析 39-41 3.6 本章小结 41-42 第4章 分类算法中基于协同进化的决策树算法 42-54 4.1 引言 42-43 4.2 问题定义与描述 43-47 4.3 协同进化算法 47-49 4.3.1 合作型协同进化算法 47 4.3.2 竞争型协同进化算法 47-48 4.3.3 协同进化算法的特点 48-49 4.4 基于协同进化的决策树算法 49-52 4.4.1 ICEDT 算法描述 49-50 4.4.2 实例分析 50-52 4.5 本章小结 52-54 第5章 算法实现及实验分析 54-60 5.1 引言 54 5.2 SISA 算法的实验 54-58 5.2.1 实验数据设置 54-55 5.2.2 实验环境设置 55 5.2.3 实验步骤 55 5.2.4 实验结果及分析 55-58 5.3 ICEDT 算法的实验 58-59 5.3.1 实验数据设置 58 5.3.2 实验环境设置 58-59 5.3.3 实验结果及分析 59 5.4 本章小结 59-60 结论 60-62 参考文献 62-66 攻读硕士学位期间承担的科研任务与主要成果 66-67 致谢 67-68 作者简介 68
|
相似论文
- 谐波齿轮传动柔轮应力及轮齿磨损分析,TH132.43
- 基于支持向量机的故障诊断方法研究,TP18
- 媒介在乡村日常生活中的角色,D422.7
- 一类孤子方程的可积离散化,O175.2
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 基于学生评教数据挖掘与教学质量分析系统的研究,TP311.13
- 基于粗糙集理论的决策树分类算法与应用研究,TP18
- 基于核心示例集的属性约简方法研究,O159
- 基于广义信息熵的决策树模型及其在绩效评价中的应用,TP18
- 基于改进的ID3算法的蛋白质纯化方法研究,Q51
- 五种决策树算法的比较研究,TP311.13
- 信用卡风险管理技术及利润预测模型,F224
- 基于改进蚁群算法的多机协同突防航迹规划方法研究,V249.1
- 基于鲁棒动态逆的小灵巧炸弹控制器设计,TJ414
- 汉语语音合成系统的改进与实现,TN912.33
- 并行与双系统协同差异进化算法及其应用,TP18
- 中国15岁以上人群乙型肝炎免疫预防的决策分析模型研究,R392.1
- 广州市乙肝相关疾病经济负担及1~14岁人群乙肝疫苗接种策略研究,R186
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|