学位论文 > 优秀研究生学位论文题录展示
粗糙集理论在数据离散化中的应用研究
作 者: 周凡程
导 师: 吴孟达
学 校: 国防科学技术大学
专 业: 系统科学
关键词: 粗糙集 离散化 Shadowed Sets 雷达辐射源识别
分类号: TP18
类 型: 硕士论文
年 份: 2012年
下 载: 51次
引 用: 0次
阅 读: 论文下载
内容摘要
连续属性离散化技术是数据预处理过程中重要的组成部分,直接关系到数据挖掘或机器学习的效果。基于粗糙集理论的数据离散过程一般分为三个步骤:提取候选断点集合;选取结果断点子集;应用结果断点子集进行离散化。第一步候选断点的确定是解决离散化问题的基础。在保证决策表相容性的前提下,使候选断点集合具有尽可能小的基数,不但可以减少结果断点集合的计算量,而且可以减小计算过程的时间和空间开销,对整个离散化算法的后继工作具有十分重要的意义。本文基于此做了如下工作:1)详细分析了基于粗糙集的离散化过程的三个步骤:提取候选断点集合;选取结果断点子集;应用结果断点子集进行离散化。其中,前两个步骤是整个离散化算法的关键,现有的离散化算法都将研究的重点放在了结果断点子集的选取上,而忽略了候选断点集合的提取。本文以候选断点集的提取为主要研究内容,进行了仔细分析。2)针对候选断点集提取,提出了基于Shadowed Sets的候选断点提取算法.该算法根据实例在单属性上的分布,对数据样本进行分类,采用ShadowedSets计算出各类的上下近似,最终提取出候选断点集。使用多组UCI数据对此算法的性能进行检验,同时还与其它候选断点集提取算法做了对比实验。实验结果表明,此算法能有效地减少数据集候选断点的数目,提高离散化算法运行速度和识别率。3)将基于Shadowed Sets的连续属性离散化算法应用到雷达辐射源信号识别中,通过分析粗糙集理论中离散化与属性约简之间的关系,认识到离散化和属性约简在本质上都是对冗余等价关系的约简,在此认识的基础上,改进了基于粗糙集的雷达辐射源识别模型结构,最后,利用该改进的雷达辐射源识别模型对雷达辐射源特征数据库进行识别,实验结果证明了基于粗糙集理论的特征选择模型能有效地提取出数据中的有用信息,简化数据结构,从而可以简化神经网络分类器的结构,缩短分类器训练时间,提高分类器泛化能力。
|
全文目录
摘要 8-9 ABSTRACT 9-11 第一章 绪论 11-21 1.1 引言 11-12 1.2 国内外研究现状分析 12-18 1.2.1 粗糙集的发展状况 12-15 1.2.2 离散化算法的发展与研究现状 15-17 1.2.3 基于粗糙集的离散化算法的研究现状 17-18 1.3 本文研究的内容及论文结构 18-21 第二章 基本知识介绍 21-31 2.1 粗糙集理论 21-24 2.1.1 知识表达系统 21-22 2.1.2 知识约简和核 22-24 2.2 基于粗糙集理论的数据离散化 24-27 2.2.1 离散化算法的任务与目标 24-25 2.2.2 离散化问题描述 25-26 2.2.3 粗糙集离散化过程分析 26-27 2.3 典型的数据离散化算法 27-31 2.3.1 等距离划分算法 27 2.3.2 等频率划分算法 27 2.3.3 Na ve Scaler 算法 27-28 2.3.4 基于布尔逻辑运算的离散化算法 28 2.3.5 基于贪心搜索思想的启发式算法 28-29 2.3.6 基于属性重要性的算法 29-31 第三章 基于 Shadowed Sets 的粗糙集快速离散化算法 31-41 3.1 候选断点集提取分析 31-34 3.2 基于 Shadowed Sets 的候选断点提取算法 34-37 3.2.1 Shadowed Sets 的基本概念 34-35 3.2.2 基于 Shadowed Sets 的候选断点集提取算法 35-37 3.2.3 候选断点集的修正 37 3.3 实验计算 37-39 3.4 结论 39-41 第四章 离散化在雷达辐射源识别中的应用 41-51 4.1 引言 41 4.2 雷达辐射源识别 41-44 4.2.1 雷达辐射源的定义 41-42 4.2.2 雷达辐射源信号识别模型结构 42-44 4.3 离散化在特征选择中的应用 44-47 4.3.1 粗糙集中离散化与属性约简之间的关系 44-45 4.3.2 改进的基于粗糙集的识别模型结构 45-47 4.4 实验计算 47-51 第五章 结论与展望 51-53 致谢 53-55 参考文献 55-59 作者在学期间取得的学术成果 59
|
相似论文
- 谐波齿轮传动柔轮应力及轮齿磨损分析,TH132.43
- 基于支持向量机的故障诊断方法研究,TP18
- 一类孤子方程的可积离散化,O175.2
- 基于连锁图的QTL综合分析方法研究,S562
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
- 基于模糊区分矩阵的区间信息系统属性约简,O159
- 动力灾害煤炭资源开采危险程度预测方法,TD713
- 大样本支持向量机研究,TP18
- 基于最小二乘支持向量机的球团矿质量分类建模,TF046.6
- RBF神经网络在城市空气质量评价中的应用研究,X823
- 基于变精度粗糙集的约简算法研究与应用,TP18
- 基于粗糙集理论的文本分类研究,TP18
- 基于支持向量机(SVM)理论的个人信用评估研究,TP18
- 基于粗糙集与模糊综合评价的供应商风险评价研究,F274
- 基于改进区分矩阵的属性约简算法研究与应用,TP18
- 基于粗糙集理论的决策信息系统属性约简算法研究,TP18
- 粗糙集知识建模方法及其在甲醇合成过程中的应用,TQ223.121
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|