学位论文 > 优秀研究生学位论文题录展示
基于信息增益的完全决策树算法研究
作 者: 刘强
导 师: 曾致远;孙燕
学 校: 华中科技大学
专 业: 空间信息科学与技术
关键词: 信息增益 完全决策树 属性分裂 范围界定参数
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 84次
引 用: 2次
阅 读: 论文下载
内容摘要
决策树分类算法作为数据挖掘技术中一个重要的分类方法,具有简洁且高效的分类效果。决策树算法通过数据样本集建立决策树模型,进而利用生成的模型对未知分类数据进行分类。目前对于决策树的研究已经有40多年的历史,这期间诞生了许许多多不同的算法。其中较为经典的ID3、C4.5、C5.0等算法均是基于信息增益理论的分类算法,这些算法有着理论清晰、方法简单且分类速度较快的特点。但同时信息增益理论在决策树属性分裂时,也存在着多值偏向等问题。本文结合信息增益理论的优势,着眼于改进决策树算法的分类精度,主要研究内容是基于信息增益的完全决策树算法。本文通过引入一种新型的决策树节点,在属性分裂时并非选择单一分裂属性,而是根据信息增益的评估结果,通过提出的范围界定参数来选择一系列分裂属性,将此方法所得的决策树称为完全决策树。节点的引入使得在保留了熵值计算的选择标准前提下,进一步改进了算法稳定性,提高了准确度,更大的发挥了基于信息增益理论的决策树算法潜力。本文将基于信息增益的完全决策树算法应用于UCI的Car Evaluation数据集中进行验证测试,同时与非完全决策树的ID3、C4.5算法进行比较。根据算法中范围界定参数的不同,完全决策树最高精度比ID3与C4.5有了一定提升。此时完全决策树构建时间相较ID3与C4.5增加并不明显。在对各算法分类准确率和时间复杂度等方面分析后得出,基于信息增益的完全决策树算法可在牺牲较少的时间复杂度情况下,有效提高分类准确率。
|
全文目录
摘要 4-5 Abstract 5-8 1 绪论 8-13 1.1 选题背景和意义 8-9 1.2 国内外研究概况 9-12 1.3 本文主要工作和章节安排 12-13 2 数据挖掘理论及决策树分类 13-21 2.1 数据挖掘理论 13-17 2.2 决策树分类 17-20 2.3 本章小结 20-21 3 典型的决策树算法分析 21-32 3.1 决策树中的信息增益理论 21-23 3.2 基于信息增益的决策树算法 23-26 3.3 其他经典决策树算法 26-29 3.4 各典型决策树算法比较分析 29-30 3.5 几种基于信息增益的改进决策树算法 30-31 3.6 本章小结 31-32 4 基于信息增益的改进算法 32-52 4.1 算法存在的问题及改进思路 32-34 4.2 改进算法描述 34-40 4.3 算法分析与比较 40-51 4.4 本章小结 51-52 5 总结与展望 52-54 5.1 总结 52-53 5.2 展望 53-54 参考文献 54-57 致谢 57
|
相似论文
- 基于改进遗传算法的神经网络输入约简,TP18
- 移动通信中客户信誉评价方法的研究与实践,F626
- 基于信息增益的贝叶斯数据挖掘算法在垃圾邮件过滤中的应用,TP393.098
- 中文文本分类算法研究,TP391.1
- 面向企业员工的素质与绩效关联分析研究,F224
- 基于有监督奇异值分解和类随机森林决策方法的肿瘤特征基因筛选研究,R730.4
- 集成学习及其应用研究,TP181
- 基于聚类分析的网络流量分类研究,TP393.06
- ID3决策树算法分析与改进,TP311.13
- 中文词义消岐研究,TP391.1
- 基于元信息的文本分类与优化技术研究与实现,TP391.1
- 基于IG_NN双层属性选择的客户流失预警研究,F224
- 基于学习的入侵检测算法研究,TP393.08
- miRNA前体与成熟体预测方法的设计与实现,TP18
- 决策树分类优化算法的研究,TP301.6
- 基于裁剪技术的非平衡评论褒贬倾向分类研究,TP391.1
- 移动用户流失预警研究方法与应用模型,TP311.13
- 基于加权树判定的快速入侵检测模型-WDTBIDM,TP393.08
- 面向支持向量机的特征约简研究,TP181
- 基于决策树算法的超市客户细分应用研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|