学位论文 > 优秀研究生学位论文题录展示

ID3决策树算法分析与改进

作 者: 张睿
导 师: 陈晓云;蓝涛
学 校: 兰州大学
专 业: 计算机技术
关键词: 数据挖掘 分类 ID3算法 信息增益 样本结构相似度 SS_ID3算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 383次
引 用: 3次
阅 读: 论文下载
 

内容摘要


数据挖掘注重学习和实践中的理论素养的培养,同样也注重在实际中的应用。数据分类是数据挖掘的一个重要组成部分,而其中的决策树算法是数据分类方法中的一种主要方法。目前,虽然已有一些新的改进方法甚至新的划分方法提出,但是这些方法都有其特定的条件与限制,没能在根本上打破ID3决策树算法的基础理论格局。基于这一背景,如何更好的对ID3决策树算法进行分析与改进依然是一个值得去仔细学习和研究的问题。本文以国家外汇管理局甘肃省分局的实际生产数据为基础,从分析ID3决策树算法并解析其优缺点入手,引入属性样本结构相似度概念,构建了样本结构相似度模型,并以该模型和属性的信息增益共同作为决策树内部节点的选择标准。改进后形成的SS_ID3决策树算法对原始ID3决策树算法的多值偏向问题进行了修正,本文对改进前后的算法进行了理论和实验验证。在理论分析和实验验证的基础上,通过对比分析能够确定,改进的SS_ID3决策树算法着眼于决策树非叶节点选择标准的优化,所使用的属性结构相似度模型干预的决策树算法,继承了原始ID3决策树算法的优点,并在多值偏向性的修正、决策树的大小控制和对分类及预测性能几方面取得了有意义的改进。本文最后在实际数据的基础上对原始ID3算法和改进的SS_ID3决策树算法的多值偏向问题和决策树的生成分析进行了理论和实验的验证。

全文目录


相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 基于词义及语义分析的问答技术研究,TP391.1
  4. 基于仿生模式识别的文本分类技术研究,TP391.1
  5. 基于图像的路面破损识别,TP391.41
  6. 基于数据挖掘技术的保健品营销研究,F426.72
  7. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  8. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  9. 基于中国土壤系统分类的土壤类型和界线确定研究,S155
  10. 面向公众的教育视频共建共享平台的设计与实践研究,G434
  11. 积极情绪对3-5岁幼儿认知灵活性的影响,B844.1
  12. 耐受苯酚的细菌新种—Comamonas zonglianii BF-3~T的分离及其多相分类研究,X172
  13. 山西果园杂草数量生态与管理策略研究,S451
  14. 太原东山油松人工林数量特征与生物多样性研究,S791.254
  15. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  16. 兖州矿区典型地物波谱数据库建设与应用研究,P208
  17. 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
  18. 基于行业参数优化模型的投资项目决策支持系统,F283
  19. 中国东海可培养微生物多样性研究及多相分类学鉴定,Q93
  20. 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
  21. Web使用挖掘与网页个性化服务推荐研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com