学位论文 > 优秀研究生学位论文题录展示
基于核心示例集的属性约简方法研究
作 者: 尹洪泽
导 师: 李法朝
学 校: 河北科技大学
专 业: 应用数学
关键词: 数据挖掘 决策树 粗糙集 信息系统 属性约简 核心属性集 确定性知识 核心示例集
分类号: O159
类 型: 硕士论文
年 份: 2012年
下 载: 13次
引 用: 0次
阅 读: 论文下载
内容摘要
随着数据库技术的发展和数据库管理系统的应用,海量信息以不同数据形式被存储起来。数据挖掘就是为了获取这些数据中有价值的信息而发展起来的一种数据处理技术。数据的属性并不是同等重要的,甚至某些属性是冗余的。因而,精炼数据库的属性集(属性约简)成为数据挖掘技术的一个重要环节。本文通过规则知识的形式化描述,提出了确定性知识与核心示例集的概念,结合决策树算法提出了基于核心示例集的决策树属性约简方法,主要工作如下:(1)本文对决策树算法的本质特点进行了研究,在将规则知识形式化的基础上,提出了确定性知识与核心示例集的概念,并证明了规则知识不变性;(2)结合决策树算法,以核心示例集的不变性为理论基础,提出了决策树的属性约简方法与核属性求解方法;(3)在非协调环境下,揭示了决策树通过强制拟合使节点纯度不为1,在确定性知识与核心示例集的概念的基础上提出了β-确定性知识和β-核心示例集,并依此建立了基于β-核心示例集的决策树属性约简方法。结合具体实例,分析了这些方法的特征与性能,结果表明,它们都具有较强的可操作性,可以有效地处理不同类型数据库的约简问题。
|
全文目录
摘要 4-5 Abstract 5-8 第1章 绪论 8-15 1.1 研究背景及意义 8-12 1.1.1 数据挖掘的概念与发展 8-9 1.1.2 数据挖掘中的基本分类算法 9-11 1.1.3 数据挖掘过程 11-12 1.2 决策树算法的国内外研究现状 12 1.3 课题的研究重点、研究意义 12-13 1.4 论文结构 13-15 第2章 决策树分类算法 15-24 2.1 决策树算法简介 15-18 2.1.1 决策树算法概述 15 2.1.2 决策树表示方法 15-16 2.1.3 决策树的生成 16-17 2.1.4 决策树算法的评价标准 17-18 2.2 常见的决策树算法 18-22 2.2.1 ID3算法概述 18-20 2.2.2 C4.5算法概述 20 2.2.3 CART算法概述 20-21 2.2.4 SLIQ算法概述 21 2.2.5 SPRINT算法概述 21-22 2.2.6 PUBLIC算法概述 22 2.3 决策树算法的研究进展 22-23 2.4 决策树算法的发展趋势 23 2.5 本章小结 23-24 第3章 基于决策树的属性约简方法研究 24-30 3.1 粗糙集属性约简方法 25 3.2 基于决策树的属性约简方法 25-27 3.2.1 规则知识的形式化描述 25-26 3.2.2 规则知识的不变性 26 3.2.3 基于决策树的属性约简步骤 26-27 3.3 实例分析 27-29 3.4 本章小结 29-30 第4章 基于决策树的核属性求解方法 30-35 4.1 核心属性的本质特征 30-32 4.2 基于决策树的核属性求解方法 32 4.3 实例分析 32-34 4.4 本章小结 34-35 第5章 基于β-核心示例集的决策树属性约简方法 35-41 5.1 最大分布约简 35-37 5.2 基于β-核心示例集的决策树属性约简 37-38 5.2.1 基本定义与相关知识 37 5.2.2 β-确定性知识和β-核心示例集 37-38 5.2.3 决策树β-精度属性约简步骤 38 5.3 实例分析 38-40 5.4 本章小结 40-41 结论 41-42 参考文献 42-46 攻读硕士学位期间所发表的论文 46-47 致谢 47
|
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 基于网络虚拟社区的企业营销风险预警系统研究,F274
- 新疆油田地面工程造价指标和管理信息系统的研究与应用,F284
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 面向绿色大学建设的高校节能体系研究,G647
- 基层部队人员日常管理信息系统设计实现,TP311.52
- 土壤环境功能区划研究,X321
- 基于GIS的温州农业资源管理信息系统的构建,S126
- 基于连锁图的QTL综合分析方法研究,S562
- Bicluster数据分析软件设计与实现,TP311.52
- 基于.Net的军队党员信息管理系统的设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 法院审判信息系统的访问控制研究,TP309
- 军用车辆管理信息系统的设计与实现,TP311.52
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 77263部队干部管理信息系统与干部综合素质考评的设计与实现,TP311.52
- 第24届大冬会竞赛管理系统项目风险管理,G812.2
中图分类: > 数理科学和化学 > 数学 > 代数、数论、组合理论 > 模糊数学
© 2012 www.xueweilunwen.com
|