学位论文 > 优秀研究生学位论文题录展示

基于粗糙集的决策树优化算法研究

作 者: 王晓平
导 师: 冯山
学 校: 四川师范大学
专 业: 基础数学
关键词: 数据挖掘 决策树 粗糙集 变精度粗糙集
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 21次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据挖掘,也称之为数据库中知识发现,涉及了人工智能、机器学习等重要研究领域。分类是数据挖掘的一个关键内容。目前,分类主用于诊断、预测、区分、甄别等方面。决策树技术是一项重要的分类技术。较其他分类模型简洁、易懂,便于操作,并且可保证分类准确性不低于其他分类模型。粗糙集能处理不确定的知识。粗糙集技术能更好的发现不准确数据及噪声数据内在的结构联系,生成更加健壮的决策树,可用于优化决策树算法。本文将对各种基于粗糙集理论的决策树生成算法进行了深入的研究,主要工作如下:1、在变精度粗糙集理论基础上,定义了变精度明确区与变精度非明确区的概念,替换原始的非明确区和明确区的概念。2、认真分析了Jinmao-Wei等人提出的基于粗糙集的单变量决策树算法HACRS的优缺点。采用C4.5算法中的信息增益率的标准替代ID3算法中的信息增益的标准,结合这两个新的概念,提出了一种基于变精度粗糙集的单变量决策树算法HACBRS算法。3、HACBRS算法在对数据集进行划分的过程中,引入分类误差参数,能对少量噪声数据对结果产生的影响进行了弱化,也不会导致生成的决策树对原来的数据集会产生过度拟合的现象,这样就使得决策树生成的泛化能力得到了大大的提高。4、将这几种算法同经典的ID3算法进行实例分析比较。5、通过分析比较,基于粗糙集理论生成的决策树要比基于信息熵的ID3算法构造的决策树规模小的多,简洁的多,可以很好的抑制噪声数据,分类精度也高得多。同时进一步验证了基于变精度粗糙集理论的决策树生成算法比基于粗糙集理论的决策树算法有一定改进方面的优势。

全文目录


摘要  3-4
Abstract  4-7
第一章 绪论  7-12
  1.1 选题背景和意义  7-8
  1.2 国内外的研究历史与现状  8-11
    1.2.1 决策树分类算法研究历史与现状  8-10
    1.2.2 粗糙集理论研究历史与现状  10-11
  1.3 本文主要研究内容和结构组织  11-12
第二章 决策树技术  12-22
  2.1 决策树技术的基本理论  12-13
  2.2 经典的决策树生成算法  13-21
    2.2.1 经典决策树生成算法的介绍  13-20
    2.2.2 各种经典算法的比较  20-21
  2.3 本章小结  21-22
第三章 粗糙集理论  22-29
  3.1 粗糙集概述  22-23
  3.2 粗糙集理论的基本概念  23-26
  3.3 变精度粗糙集理论  26-27
  3.4 粗糙集在决策树算法中的应用  27-28
  3.5 本章小结  28-29
第四章 基于粗糙集的决策树优化算法研究  29-47
  4.1 基于粗糙集理论的决策树构造算法  29-34
    4.1.1 基于粗糙集的单变量决策树算法 HACRS  29-32
    4.1.2 基于粗糙集的多变量决策树构造算法  32-34
  4.2 基于变精度粗糙集的单变量决策树算法 HACBRS  34-38
  4.3 决策树生成实例与分析  38-46
    4.3.1 基于粗糙集理论构造决策树  39-42
    4.3.2 基于变精度粗糙集理论构造决策树  42-43
    4.3.3 基于 ID3 算法构造决策树  43-45
    4.3.4 算法的比较分析  45-46
  4.4 本章小结  46-47
第五章 结论及下一步展望  47-49
  5.1 主要工作总结  47
  5.2 未来展望  47-49
参考文献  49-52
致谢  52

相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 基于数据挖掘技术的保健品营销研究,F426.72
  3. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  4. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  5. 基于连锁图的QTL综合分析方法研究,S562
  6. Bicluster数据分析软件设计与实现,TP311.52
  7. 基于变异粒子群的聚类算法研究,TP18
  8. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  9. 基于遗传算法和粗糙集的聚类算法研究,TP18
  10. 基于粗糙集的城市区域交通绿时控制系统研究,TP18
  11. 基于数据挖掘的税务稽查选案研究,F812.42
  12. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  13. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  14. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  15. 基于行业参数优化模型的投资项目决策支持系统,F283
  16. 数据集市在电信经营分析中的应用研究,TP311.13
  17. 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
  18. 基于数据流挖掘技术的流量识别,TP393.06
  19. 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
  20. 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
  21. 基于Moodle的高职网络教学系统设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com