学位论文 > 优秀研究生学位论文题录展示
数据挖掘在煤炭综合统计系统的应用研究
作 者: 白冬艳
导 师: 龚炳江
学 校: 河北工程大学
专 业: 计算机应用技术
关键词: 数据挖掘 决策树 粗糙集 综合统计系统 煤炭企业
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 37次
引 用: 0次
阅 读: 论文下载
内容摘要
煤炭是我国的重要能源,煤炭企业综合统计是国家综合统计的基础之一,是国家能源统计的重要组成部分。同时也是煤炭行业最重要的管理业务,是其一切业务活动的协调、指导与控制的依据。而目前我国煤炭企业使用的现有系统,有一定的局限性,功能不完备,稳定性差,不能对数据进行深层次处理,更没有决策功能,已经直接影响到煤炭企业快速决策、科学决策和管理水平的提高。因此,研究开发决策型的煤炭企业综合统计系统不仅具有重要的理论意义,也具有重要的现实意义。针对现有煤炭综合统计系统存在的不足,本课题引入数据挖掘技术,开发了三层煤炭综合统计系统,在传统系统的基础上增加数据挖掘层。通过深入比较了决策树法、神经网络法、贝叶斯网络法和粗糙集等多种数据挖掘算法,提出了一种基于决策树和粗糙集相结合的多变量决策算法。在建立决策树之前,采用粗糙集理论的决策表约简进行属性约简,约简后的属性集合,一是保持分类质量不变,二是属性集合中不含冗余属性。将约简后得到的条件属性集用于构造决策树,这样有利于减小待建决策树的规模。在建立决策树过程中,约简后的多个条件属性,利用距离函数及两个等价关系相对泛化的概念解决了多变量检验的问题,从而得到规模更小、精度更高的决策树。运用该算法构建了煤炭企业矿山效益决策模型,实现了对矿山效益的综合评价。根据评价结果,发现影响矿山效益的主要因素,进而提出提高矿山效益相应改进措施。该系统的建立,为企业决策和生产经营快速提供数据支持,从而提高煤炭企业管理水平,进而提升煤炭企业竞争力。
|
全文目录
摘要 6-7 Abstract 7-11 第1章 绪论 11-16 1.1 课题研究背景和科学意义 11-12 1.2 国内外研究现状 12-14 1.2.1 数据挖掘技术研究现状 12-13 1.2.2 煤炭综合统计系统研究现状 13-14 1.3 本文的研究内容与组织结构 14-16 第2章 数据挖掘及相关技术 16-37 2.1 数据挖掘概述 16-22 2.1.1 数据挖掘的产生与概念 16-17 2.1.2 数据挖掘的任务和功能 17-18 2.1.3 数据挖掘过程与实施步骤 18-19 2.1.4 数据挖掘技术的主要方法 19-22 2.2 决策树技术 22-30 2.2.1 决策树简介 22-23 2.2.2 建立决策树 23-24 2.2.3 决策树剪枝 24-25 2.2.4 由决策树生成分类规则 25-26 2.2.5 几种典型的决策树分类算法 26-30 2.3 粗糙集技术 30-36 2.3.1 粗糙集的简介 30 2.3.2 粗糙集的基本概念 30-32 2.3.3 决策表的约简 32-35 2.3.4 粗糙集理论的特点 35 2.3.5 粗糙集理论的应用 35-36 2.4 本章小结 36-37 第3章 系统总体设计 37-49 3.1 系统开发的目的 37 3.2 系统的功能 37-40 3.3 系统的关键技术 40-44 3.4 系统的总体设计方案 44-48 3.4.1 系统的开发方式 44-47 3.4.2 系统的结构模式 47-48 3.4.3 系统开发平台的选择 48 3.5 本章小结 48-49 第4章 矿山效益评价方法的研究 49-62 4.1 矿山效益评价指标体系的构建 49-51 4.1.1 矿山效益评价指标的选择原则 49-50 4.1.2 矿山效益评价指标体系的构建 50-51 4.2 矿山效益评价方法的选择原则 51-52 4.3 国内现行的矿山效益评价方法分析 52-54 4.4 基于粗糙集的多变量决策树构造法的设计 54-61 4.4.1 问题提出的背景 54-56 4.4.2 算法设计的思想 56-58 4.4.3 构造基于粗糙集的多变量决策树算法 58-59 4.4.4 实例分析 59-61 4.5 本章小结 61-62 第5章 矿山效益评价模型的实现 62-70 5.1 效益评价模型的建立 62-67 5.1.1 构建矿山效益评价原始数据库 62-63 5.1.2 数据预处理 63-65 5.1.3 构建矿山效益评价模型 65 5.1.4 提取规则 65-67 5.2 实例验证 67-69 5.2.1 峰峰集团有限公司简介 67-68 5.2.2 峰峰集团公司矿山效益评价 68-69 5.2.3 效益结果分析 69 5.3 本章小结 69-70 结论 70-72 致谢 72-73 参考文献 73-77 作者简介 77-78 攻读硕士学位期间发表的论文和参加科研情况 78-79
|
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 基于连锁图的QTL综合分析方法研究,S562
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 煤炭企业节能运行机制评价研究,F206
- 山西煤炭企业资源整合重组问题研究,F426.21
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|