学位论文 > 优秀研究生学位论文题录展示

基于交互信息的连续属性决策树学习算法

作 者: 李华
导 师: 王熙照;哈明虎
学 校: 河北大学
专 业: 基础数学
关键词: 归纳学习 机器学习 决策树 最小信息熵 交互信合 单边三角形模糊数
分类号: O159
类 型: 硕士论文
年 份: 2004年
下 载: 87次
引 用: 0次
阅 读: 论文下载
 

内容摘要


Fayyad决策树学习算法的核心是使用信息熵的下降速度作为选取扩展属性标准的启发式,但它仅考虑了条件属性与决策属性的关系,没有考虑条件属性间的关系(即交互性),因此极有可能选择对继续分类无实际意义或意义相对不大的冗余属性,不能实现信息熵的真正减少。基于此种考虑,本文给出该算法的一个改进版本,它在选择扩展属性时不仅要求该属性带来的信息熵尽可能小,而且要求其与已经使用过的各属性之间的交互性(即交互信息)尽可能小。本文首先从全局角度描述这两种算法,然后从训练准确率与测试准确率,决策树的结构等方面对这两种算法进行了比较,归纳出交互信息在决策树学习算法中的作用,证明了改进算法的有效性;同时考虑将Fayyad决策树学习算法在单边三角形模糊数属性意义下进行推广,对于单边三角形模糊数属性构造出一种决策树学习算法,并对算法的复杂度,效率进行了分析。

全文目录


摘要  4-5
ABSTRACT  5-7
第1章 绪论  7-11
  1.1 背景知识  7-8
  1.2 决策树归纳学习的产生及研究现状  8-10
  1.3 本文的研究重点和主要内容  10-11
第2章 FAYYAD决策树学习算法  11-17
  2.1 算法简介  11-15
  2.2 学习算法中关于属性的最优割点的讨论  15-17
第3章 基于交互信息的连续属性决策树学习算法  17-24
  3.1 算法简介  17-20
  3.2 两种算法的比较  20-24
第4章 单边三角形模糊数属性决策树学习算法  24-33
  4.1 算法简介  24-29
  4.2 学习算法中关于最优割点的讨论  29-33
第5章 结束语  33-34
参考文献  34-37
攻读硕士学位期间科研工作情况  37-38
致谢  38

相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 教学质量评估数据挖掘系统设计与开发,TP311.13
  3. 基于数据分布特征的文本分类研究,TP391.1
  4. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  5. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  6. Android恶意软件静态检测方案的研究,TP309
  7. 监督主题模型的研究与应用,TP391.1
  8. 基于失真效应的图像质量评价与分类,TP391.41
  9. 基于学习的逆向运动学人体运动合成,TP391.41
  10. 基于内容的网页恶意代码检测的研究与实现,TP393.092
  11. 学术主页信息抽取系统的研究,TP393.092
  12. 基于学生评教数据挖掘与教学质量分析系统的研究,TP311.13
  13. 社会化网络中的推荐算法及其应用,TP391.3
  14. 数据挖掘在邮件反垃圾系统中的应用,TP393.098
  15. 基于粗糙集理论的决策树分类算法与应用研究,TP18
  16. 基于核心示例集的属性约简方法研究,O159
  17. 基于自学习的社会关系抽取的研究,TP391.1
  18. 基于广义信息熵的决策树模型及其在绩效评价中的应用,TP18
  19. 基于统计与图模型的若干机器学习算法及其应用,TP181
  20. 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
  21. 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41

中图分类: > 数理科学和化学 > 数学 > 代数、数论、组合理论 > 模糊数学
© 2012 www.xueweilunwen.com