学位论文 > 优秀研究生学位论文题录展示

教务管理信息系统伪缺失值检测研究

作 者: 伍丁辉
导 师: 阳小华
学 校: 南华大学
专 业: 计算机应用技术
关键词: 数据清理 伪缺失值检测 教务管理
分类号: TP399-C1
类 型: 硕士论文
年 份: 2010年
下 载: 26次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着社会信息化程度不断提高,大量信息系统广泛应用于不同领域,积累了海量数据。为了使信息系统能够有效可靠地支持组织的工作,要求系统的数据必须准确的反映现实世界的真实状况。而在实际运行的系统中,数据重复、数据缺失、数据不一致等问题普遍存在,数据质量(Information Quality)问题日益突出,引起了学术界和企业界的高度重视。本文面向高校教育信息化,针对学分制教务管理信息系统中出现的数据质量问题进行了深入的探讨和研究,认真分析该系统各个功能模块中出现的数据质量问题,并以解决学籍管理模块中出现的伪缺失值问题为研究重点。针对数据库中存在的伪缺失值问题,本文首先介绍伪缺失值的定义以及常见的伪缺失值检测方法,比如:基于统计的方法(又包含基于分布的方法和基于深度的方法)、基于距离的方法、基于密度的方法、基于聚类的方法、基于偏离的方法等。伪缺失值记录是指用户没有进行某项信息填写时系统采用属性值域内的某个合法值缺省填入数据库中而产生的与实际不相符的记录,该类记录的大量存在给数据分析统计(假设性检验、相关性分析和回归性分析等)的结果带来严重的偏差,现有方法在伪缺失值被大量使用的情况下检测效果不是很理想,为了有效的检测出教务管理系统中存在的伪缺失值记录,本文结合无偏样本同分布相关的原理以及教务管理系统的实践应用要求,提出一种简化的基于单属性同分布原理的伪缺失值检测算法,并应用教务管理信息系统中的学籍信息数据对算法的有效性和可行性进行实验验证。最后在认真分析伪缺失值产生机制以及教务管理信息系统业务流程的前提下,从面向对象程序开发的角度,对伪缺失值检测模块进行设计,确定检测操作的用户界面,绘制业务逻辑层的主要设计文档,包括:流程图、时序图、类图,详细分析并确定了数据访问层主要存储过程的功能。完成伪缺失值检测模块与现有教务管理信息系统集成的基本设计工作。

全文目录


摘要  5-6
Abstract  6-8
插图索引  8-9
附表索引  9-10
第一章 绪论  10-22
  1.1 数据质量  11-15
    1.1.1 数据质量的概念及分类  11-13
    1.1.2 单数据源数据质量问题  13-14
    1.1.3 多数据源集成时数据质量问题  14-15
  1.2 数据清理内涵及原理  15-16
  1.3 数据清理研究现状分析  16-20
    1.3.1 国外研究动态  16-19
    1.3.2 国内研究动态  19-20
    1.3.3 当前研究述评  20
  1.4 论文研究目的与内容安排  20-21
  1.5 本章小结  21-22
第二章 伪缺失值清理  22-32
  2.1 伪缺失值的概念及定义  23-25
  2.2 伪缺失值检测方法  25-30
    2.2.1 基于统计的方法  25-27
    2.2.2 基于距离的方法  27-28
    2.2.3 基于密度的方法  28
    2.2.4 基于聚类的方法  28-29
    2.2.5 基于偏离的方法  29-30
  2.3 其他方法  30
  2.4 本章小结  30-32
第三章 教务管理系统学籍信息伪缺失值检测算法  32-46
  3.1 启发式伪缺失值清理方法  33-38
    3.1.1 启发式的嵌入无偏样本  33-36
    3.1.2 最大无偏样本寻找方法  36-38
  3.2 启发式算法在学籍信息伪缺失值检测应用中改进  38-40
    3.2.1 教务管理系统领域伪缺失值情况分析  38-39
    3.2.2 单属性最大同分布子集计算方法  39-40
  3.3 学籍信息伪缺失值检测算法运行实例  40-44
  3.4 多个属性存在时参考属性选择策略讨论  44-45
  3.5 本章小结  45-46
第四章 学籍信息中伪缺失值检测模块设计  46-54
  4.1 需求分析  46-47
  4.2 系统设计  47-53
    4.2.1 用户界面层  48-50
    4.2.2 业务逻辑层  50-52
    4.2.3 数据访问层  52-53
  4.3 本章小结  53-54
第五章 总结和展望  54-56
  5.1 工作总结  54
  5.2 工作展望  54-56
参考文献  56-63
成果目录以及参与项目  63-64
致谢  64

相似论文

  1. 大连理工大学城市学院教务管理研究,G647
  2. 湖南网络职院教务综合管理平台的设计与实现,TP311.52
  3. 高校教务管理系统与实现,TP311.52
  4. 高职高专教务管理系统研究与实现,TP311.52
  5. 基于SOA的学籍管理系统的研究与实现,TP311.52
  6. 基于B/S架构的教务管理系统设计及实现,TP311.52
  7. 基于.NET的高职院校教务管理系统的设计与实现,TP311.52
  8. 某成人高校教务管理系统的设计与实现,TP311.52
  9. 网络教育教务管理系统设计与安全管理,TP311.52
  10. 高校教务管理信息化改革研究,G647
  11. 基于J2EE平台的教务管理系统的设计,TP311.52
  12. 基于XML的数据预处理关键技术研究及应用,TP311.13
  13. 中国西门塔尔牛遗传评估技术体系的建立,S823
  14. 高校教务管理系统安全方案设计,TP393.08
  15. Hadoop的重复数据清理模型研究与实现,TP338.8
  16. Oracle环境下数据迁移技术研究与实现,TP311.138
  17. 基于C/S和B/S的教务管理系统的设计与实现,TP311.52
  18. 辽宁科技学院综合教务管理系统设计与实现,TP311.52
  19. 数据挖掘技术在高校成人教育学生成绩分析中的应用研究,TP311.13
  20. 基于Web Services的西安杨森渠道管理系统开发,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 在其他方面的应用
© 2012 www.xueweilunwen.com