学位论文 > 优秀研究生学位论文题录展示
数据挖掘在中央广播电视大学学生流失分析中的应用
作 者: 张伊娜
导 师: 王保保; 徐向前
学 校: 西安电子科技大学
专 业: 计算机技术
关键词: 数据挖掘 OLAP 算法 学生流失分析
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 23次
引 用: 0次
阅 读: 论文下载
内容摘要
经历信息数据极速积累的阶段之后,现如今人们处在一个“信息爆炸”的时代,面对几何速度倍增的数据,人们越来越倾向于数据挖掘技术(Data Mining)去探索潜在的信息。本文以中央广播电视大学(简称"中央电大" CRTVU)的有部分在籍生自动终止学习,而学校无法获知的情况为研究背景,以SQLServer2005的SSIS和SSAS组件为硬件平台,以电大网络版教务管理系统、CPS教务管理系统数据库数据为研究数据源,探讨数据挖掘技术在分析中央电大在校生流失的研究和应用。其主要工作是利用数据仓库、联机分析处理和数据挖掘三种技术对电大学生流失分析进行处理,实现了三种技术相互融合,建立中央电大学生流失分析系统框架。同时,论证相关算法,建立数据仓库,设计和实现了基于流失分析多维数据立方体,并且设计和运用了针对不同分析目的而建立的数据挖掘模型,包括基于决策树分类挖掘模型、基于贝叶斯分类预测模型、基于关联规则的影响因素分析模型,最后对利用三个模型进行实践分析及模型评估,针对分析的结果及挖掘的信息,建立相关流失预警机制。本文在探讨数据挖掘技术的同时也为下一步预警机制工作的开展打好基础。
|
全文目录
摘要 3-4 Abstract 4-7 第一章 绪论 7-11 1.1 研究背景及选题意义 7-9 1.1.1 研究背景 7-8 1.1.2 选题意义 8-9 1.2 论文主要工作 9 1.3 论文结构 9-11 第二章 数据挖掘技术相关理论 11-19 2.1 数据仓库(DW) 11-13 2.1.1 数据仓库的定义 11 2.1.2 数据仓库的特征 11-12 2.1.3 数据仓库的体系结构 12-13 2.2 联机分析处理(OLAP) 13-14 2.2.1 OLAP 定义及相关概念 13-14 2.2.2 OLAP 的分析操作 14 2.3 数据挖掘(DM) 14-19 2.3.1 数据挖掘的定义 14-15 2.3.2 数据挖掘的功能 15 2.3.3 数据挖掘的步骤 15-17 2.3.4 数据挖掘厂商和工具 17-19 第三章 数据挖掘在流失分析中运用 19-36 3.1 业务分析及需求分析 19-25 3.1.1 研究重点及业务依据 19-21 3.1.2 流失状态定义 21-22 3.1.3 原因及对策建议 22 3.1.4 常用流失分析技术算法的比较 22-24 3.1.5 基于分析电大学生流失的算法选择及原因 24-25 3.2 基于决策树的流失分类及预测 25-32 3.2.1 分类方法 25-26 3.2.2 预测 26 3.2.3 决策树 26-30 3.2.4 基于决策树的流失分析算法设计及流程 30-32 3.3 基于贝叶斯的流失预测分析 32-34 3.3.1 贝叶斯(Na ve Bayes) 32-33 3.3.2 基于贝叶斯流失预测的算法设计及流程 33-34 3.4 基于关联规则的流失影响因素分析 34-36 3.4.1 关联规则 34-35 3.4.2 基于关联规则的流失状态影响因素分析算法流程 35-36 第四章 中央电大流失分析系统的设计和建立 36-53 4.1 中央电大学生流失分析系统总体设计 36-39 4.1.1 设计目标 36 4.1.2 系统结构 36-38 4.1.3 功能模块 38 4.1.4 运行环境及解决方案 38-39 4.2 数据仓库设计和建立 39-53 4.2.1 设计主题 39-40 4.2.2 多维立方体设计 40-45 4.2.3 ELT 过程 45-50 4.2.4 流失分析数据 ETL 50-53 第五章 OLAP 及数据挖掘模型建立 53-61 5.1 联机分析处理 OLAP 53-56 5.1.1 多维数据集建立及生成 53-55 5.1.2 多维数据集分析及应用 55-56 5.2 数据挖掘模型建立 56-61 5.2.1 流失分类模型建立 57-58 5.2.2 流失预测模型建立 58-59 5.2.3 流失原因分析模型建立 59-61 第六章 模型应用实例 61-77 6.1 基于 OLAP 的相关主题分析 61-65 6.1.1 相关主题分析 61 6.1.2 分析实例 61-65 6.2 数据挖掘模型的应用及评估 65-77 6.2.1 分类模型应用及评估 65-69 6.2.2 预测模型应用及评估 69-73 6.2.3 流失原因分析模型应用及评估 73-77 第七章 总结与展望 77-78 致谢 78-79 参考文献 79-80
|
相似论文
- 基于差分进化算法的JSP环境下成套订单研究,F273
- 基于图的标志SNP位点选择算法研究,Q78
- 高灵敏度GNSS软件接收机的同步技术研究与实现,P228.4
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 基于Thermo-Calc三元共晶合金凝固路径的耦合计算,TG111.4
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
- 基于感性负载的车身网络控制系统,U463.6
- 基于蚁群算法的电梯群优化控制研究,TU857
- 高精度激光跟踪装置闭环控制若干关键问题研究,TN249
- 半导体激光器热电控制技术研究,TN248.4
- AES算法及其DSP实现,TN918.1
- 基于UWB脉冲信号的测距定位技术,TN929.5
- 基于TS101的DFT输出子集算法研究及软件实现,TN911.72
- 高光谱图像空—谱协同超分辨处理研究,TN911.73
- DBF接收机用于二维测向算法的研究,TN851
- 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
- IEEE802.16e信道编译码算法研究,TN911.22
- LDPC码译码算法的研究,TN911.22
- 频繁图结构并行挖掘算法的研究与实现,TP311.13
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|