学位论文 > 优秀研究生学位论文题录展示

粗糙集及其在KDD中的应用研究

作 者: 年福忠
导 师: 李明
学 校: 兰州理工大学
专 业: 控制理论与控制工程
关键词: 粗糙集 数据挖掘 知识发现 约简 相似
分类号: TP18
类 型: 硕士论文
年 份: 2004年
下 载: 156次
引 用: 0次
阅 读: 论文下载
 

内容摘要


粗糙集(Rough Set,RS)理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。RS理论是由波兰学者Plawlak.Z在1982年提出的。1991年Plawlak.Z发表了专著《Rough set:Theoretical Aspects ofReasoning about Data》,系统全面地阐述了RS理论,奠定了严密的数学基础,从而掀起了粗糙集的研究高潮。该书与1992年出版的RS理论应用专集较好地总结了这一时期RS理论与实践的研究成果,促进了它的进一步发展,现已成为学习和应用RS理论的重要文献。从1992年至今,每年都召开以RS为主题的国际会议,推动了RS理论的拓展和应用。目前RS理论已引起了越来越多的科研人员的关注。粗糙集理论的应用和其算法的研究,是近年来知识发现数据挖掘领域的一个热门话题。粗糙集当中有一个核心问题就是约简,所以,有关约简算法的研究也有很多,但无论是A.Skrown的分辨矩阵还是Pawlak的原始算法,都是从属性的约简开始的。本文通过分析决策表约简规则的本质,提出了一种属性值的直接约简算法,并通过一个商场的购物决策行为验证了我们的算法的正确性,从而简化了约简算法的步骤。经典粗糙集是基于不可区分关系,即等价关系的。事实上,在实际应用中由于所处理的数据不完整,也就很难满足等价关系这一条件。而相似关系是一种普遍存在的关系,所以,用相似关系来代替经典粗糙集的不可区分关系是一种自然的推广方式。本文立足于应用,进一步分析了经典粗糙集在实际应用中的缺点和局限性以及Roman slowinski和Daniel Vanderpooten提出的一种称之为ε-indiscernibility的算法所存在的潜在决策风险,并就此,对前ε-indiscernibility算法进行了改进,增强了这一算法的适应性,从而降低了决策者的决策风险,并通过一个银行客户信贷问题得到了验证。

全文目录


第一章 绪论  5-9
  1.1 粗糙集理论的研究与发展现状  5-7
  1.2 目前的研究热点和本文的主要贡献  7-8
  1.3 论文的结构  8-9
第二章 数据挖掘  9-19
  2.1 数据挖掘简述  9-10
  2.2 数据挖掘研究内容和本质  10-12
  2.3 数据挖掘的流程  12-14
  2.4 数据挖掘常用技术  14-16
  2.5 数据挖掘未来研究方向  16
  2.6 数据挖掘热点  16-19
第三章 粗糙集  19-35
  3.1 概述  19-21
  3.2 知识的约简  21-24
    3.2.1 一般约简  21-22
    3.2.2 相对约简  22-23
    3.2.3 分辨矩阵  23-24
  3.3 决策表的约简  24-35
第四章 基于属性值的约简算法  35-42
  4.1 什么是属性值的约简  35-36
  4.2 属性值的约简在决策表当中的应用  36-42
第五章 基于相似关系的粗糙集  42-52
  5.1 相似关系  42-43
  5.2 相似关系与粗糙近似  43-45
  5.3 相似关系的构建原理  45-47
  5.4 一种简单的相似关系:ε-indiscernibility  47-48
  5.5 对ε-indiscernibility相似关系的改进  48-52
第六章 总结  52-53
参考文献  53-56
致谢  56

相似论文

  1. 基于句法特征的代词消解方法研究,TP391.1
  2. 多邮件自动文摘的关键技术研究,TP391.1
  3. 个性化检索中相似用户群的获取与更新,TP391.3
  4. 基于支持向量机的故障诊断方法研究,TP18
  5. 构式语法观照下的高中英语双及物结构教学研究,G633.41
  6. 基于数据挖掘技术的保健品营销研究,F426.72
  7. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  8. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  9. 基于变异粒子群的聚类算法研究,TP18
  10. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  11. 基于遗传算法和粗糙集的聚类算法研究,TP18
  12. 基于粗糙集的城市区域交通绿时控制系统研究,TP18
  13. 旅游对芦芽山国家级自然保护区典型植被的影响,S759.9
  14. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  15. 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
  16. WordNet和《中国分类主题词表》的映射研究,G254
  17. 粗糙集的增量式属性约简研究,TP18
  18. 知识粒度的计算及其在属性约简中的应用研究,TP18
  19. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  20. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  21. Web使用挖掘与网页个性化服务推荐研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com