学位论文 > 优秀研究生学位论文题录展示
关联规则算法在高职院校贫困生认定工作中的应用
作 者: 曹路舟
导 师: 周爱武
学 校: 安徽大学
专 业: 计算机应用技术
关键词: 数据挖掘 数据仓库 关联规则 Apriori算法 FP-growth算法
分类号: G717
类 型: 硕士论文
年 份: 2011年
下 载: 69次
引 用: 0次
阅 读: 论文下载
内容摘要
随着高职类院校招生规模的迅速扩大,贫困生数量也随之急剧增加,贫困生问题已成为学校学生工作的重要内容之一。然而,传统的贫困生认定工作通过这些年的工作实践后,发现存在很多的不足之处,迫切需要一套科学规范、易于操作的方法来完善贫困生认定工作,使贫困生认定工作能够高效、有序、合理地进行。因此,对高职类院校贫困生认定的研究有着重要的意义。高职类院校通过多年的发展,已经累积了大量的数据,如此多的数据在给教育工作者提供便利的同时也带来了很多的困惑,如何正确寻求隐藏在数据背后的有价值的信息以及发现蕴含在海量数据背后的潜在的联系和规则呢?数据挖掘技术可以帮助我们解决这个问题。数据挖掘技术融合了多个学科的知识,它能够从海量的数据中发现我们事先并不知道但却对我们有价值的信息。本文首先介绍了数据挖掘的基本知识,包括数据挖掘的概念、分类、过程及其挖掘常用技术;其次介绍了数据挖掘前的数据预处理,生成经过集成和转换处理后的数据信息总表;再次提出了关联规则的相关算法,包括Apriori算法和FP-growth算法以及在此基础上改进型的算法,接着利用这些算法对经过预处理的数据进行数据挖掘,生成相应的关联规则,对几种常用的关联规则算法进行了比较。从一定程度上来说,改进型的算法在寻求频繁项目集上减少了时间,尤其对数据仓库中巨大数据量进行挖掘的时候,效果明显,但是不管采用论文中介绍的哪种关联规则算法进行的数据挖掘所生成的关联规则结果应该都是一样的;最后把生成的关联规则结果与学校贫困生资助系统中实际的贫困生的相关信息作比较,分析挖掘效率,并说明产生这种结果的原因以及指出在以后贫困生认定过程中所要加强关注的方面。数据挖掘的技术还有很多种,而且每种挖掘技术的挖掘效率也不一定完全相同,针对具体的问题如何去选择好的挖掘算法,提高挖掘效率是今后研究的一个重要方向;而且目前高职类院校在学生管理工作中使用数据挖掘技术的地方还不多也不够深入,所以对数据挖掘技术在高职类院校贫困生认定工作中的应用研究有着广阔的前景。
|
全文目录
摘要 3-5 Abstract 5-7 目录 7-9 第一章 引言 9-14 1.1 研究背景 9-10 1.2 数据挖掘技术的研究现状及发展 10-12 1.2.1 数据挖掘技术的研究现状 10-11 1.2.2 数据挖掘的发展 11-12 1.3 论文研究内容和结构 12-14 第二章 数据挖掘的知识 14-25 2.1 知识发现与数据挖掘的概念 14-17 2.1.1 知识发现 14-15 2.1.2 数据挖掘 15-17 2.1.3 数据挖掘与传统分析方法 17 2.2 数据仓库与数据挖掘 17-19 2.2.1 数据仓库的概念和特点 17-18 2.2.2 数据仓库技术与数据挖掘技术的区别 18 2.2.3 数据仓库技术与数据挖掘技术的联系 18-19 2.3 数据挖掘的分类 19 2.4 数据挖掘的任务 19-20 2.5 数据挖掘的特点 20 2.6 数据挖掘的过程 20-22 2.7 数据挖掘的常用技术 22-24 2.8 本章小结 24-25 第三章 关联规则挖掘算法 25-35 3.1 关联规则的基本概念 25-26 3.2 关联规则的分类 26 3.3 关联规则的算法 26-34 3.3.1 Apriori算法 27-29 3.3.2 基于Apriori算法的改进方法 29-31 3.3.3 FP-growth算法 31-34 3.4 本章小结 34-35 第四章 贫困生认定前的数据预处理 35-43 4.1 问题分析 35-36 4.2 经济困难学生认定标准 36-37 4.3 数据分析 37-40 4.4 数据处理 40-42 4.5 本章小结 42-43 第五章 关联规则在贫困生认定中的应用 43-49 5.1 数据准备 43-45 5.2 数据结果及分析 45-48 5.2.1 挖掘关联规则 45-46 5.2.2 分析和评估 46-48 5.3 本章小结 48-49 第六章 研究工作总结及展望 49-51 6.1 研究工作总结 49-50 6.2 展望 50-51 参考文献 51-55 致谢 55-56 攻读硕士学位期间发表的学术论文 56
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于关联规则的结构化浏览技术及其应用,TP391.41
- 基于数据挖掘的信用卡客户激活与响应度研究,F832.2
- 银行个人客户关系管理系统的设计与实现,TP311.52
- 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
- PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
- 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
- ⅡS日志挖掘在电子商务网站邮件营销中的应用研究,TP311.13
- 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
- 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
- 基于领域本体的海洋环境数据仓库设计,TP311.13
中图分类: > 文化、科学、教育、体育 > 教育 > 职业技术教育 > 学校管理
© 2012 www.xueweilunwen.com
|