学位论文 > 优秀研究生学位论文题录展示

决策树优化与关联规则挖掘算法研究

作 者: 李秋颖
导 师: 刘智
学 校: 大连海事大学
专 业: 计算机科学与技术
关键词: 数据挖掘 变精度粗糙集 决策树 多类标数据 关联规则
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 265次
引 用: 3次
阅 读: 论文下载
 

内容摘要


数据挖掘技术是人工智能和机器学习的重要研究领域。目前,相关挖掘方法的研究主要集中在特征提取、属性约简、算法效率、分类精度、特定领域背景下的相关方法改进及应用等多个方面。在众多的数据挖掘方法中,关联规则挖掘方法和决策树分类方法具有算法计算量小、运行时间短、生成的结果易于理解等优点,因此在理论研究及实际应用方面拥有广阔的发展前景。为此,本文通过对现有相关算法的深入分析和研究,提出了相应的改进算法,并采用UCI数据进行对比测试,取得了较好的实验效果。其中,主要研究工作包括如下三个方面:(1)传统的频繁项集挖掘算法会生成大量的短模式集,但是实际上用户真正感兴趣是长模式集生成的规则。因此,本文提出了一种基于前后件约束和长度递减支持度约束的频繁闭项集生成算法(ACLCMiner)。实验证明该算法极大地减少了频繁项集的生成数量并提高了算法效率。(2)现有的决策树算法存在属性选择困难、易受噪声数据影响和泛化能力低等不足。而基于变精度粗糙集构建的决策树算法具有较好的分类效果,且能够容忍噪声数据。为此,本文分析了现有的基于变精度粗糙集的决策树算法,针对其中存在的不足,提出了一种综合考虑了当前结点的加权近似精度、信息增益和属性取值个数的属性选择标准——属性重要度。基于该标准的决策树算法CGVPRSDT能够有效提高分类准确率。(3)针对现有的多值属性多类标决策树分类算法的不足,本文提出了新的多值属性和多类标数据的决策树算法。算法中提出了一种基于非噪声类标集的相似度计算公式,该公式综合考虑了类标集的相似性以及噪声数据的影响。另外,算法改进了原有的结点停止分裂条件。实验证明改进的多值属性多类标决策树算法具有较高的分类精度和抗噪声能力。

全文目录


相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 基于数据挖掘技术的保健品营销研究,F426.72
  3. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  4. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  5. Bicluster数据分析软件设计与实现,TP311.52
  6. 基于变异粒子群的聚类算法研究,TP18
  7. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  8. 基于遗传算法和粗糙集的聚类算法研究,TP18
  9. 基于数据挖掘的税务稽查选案研究,F812.42
  10. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  11. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  12. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  13. 教学质量评估数据挖掘系统设计与开发,TP311.13
  14. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  15. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  16. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  17. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  18. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  19. 基于关联规则的结构化浏览技术及其应用,TP391.41
  20. 银行个人客户关系管理系统的设计与实现,TP311.52
  21. 基于WEB平台的家电类产品智能导购系统的研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com