学位论文 > 优秀研究生学位论文题录展示
一个用于辅助审计的数据仓库的设计与实现
作 者: 沈洁
导 师: 杨季文
学 校: 苏州大学
专 业: 计算机应用技术
关键词: 数据仓库 数据挖掘 层次聚类 密度聚类 审计
分类号: TP311.13
类 型: 硕士论文
年 份: 2007年
下 载: 188次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机应用的普及,我国绝大多数企事业单位实现了会计电算化,使得审计工作的对象发生了质的变化,对审计提出了更高的要求。目前的审计工作还不能适应这种变化。面对海量的被审计数据,审计人员很难有效地找出疑点并总结出可复用的审计经验。辅助审计的数据仓库的建立在一定程度上解决了上述问题。本文首先介绍了辅助审计的数据仓库的总体设计和系统结构,并描述了数据仓库管理器中数据准备模块和数据挖掘模块的设计方案和功能组成。在此基础上,重点介绍了数据准备模块中数据采集和数据预处理子模块的实现方法以及辅助审计的数据挖掘模型的设计和实现方法。随后,本文就系统中使用的数据挖掘算法进行了深入的研究和探讨,阐述了现有的数据聚类算法的优缺点。针对现有聚类算法的不足,本文提出了K-CURE层次聚类算法和LBCG网格密度聚类算法,并通过实验数据展示了算法的有效性。本文所介绍的用于辅助审计的数据仓库能完成对被审计数据的抽取、存储、转换、分析等工作,可以有效地帮助审计人员在海量数据中快速找出疑点和疑点的规律,促进了审计手段的革新,具有较强的实用价值。同时,本文对大容量数据的密度聚类算法和层次聚类算法的研究和改进,对促进同类问题的研究具有一定的理论价值和借鉴意义。
|
全文目录
摘要 3-4 Abstract 4-9 第1章 引言 9-15 1.1 课题背景 9-11 1.2 课题内容 11-12 1.3 课题意义 12-13 1.4 本文组织结构 13-15 第2章 相关技术和研究现状 15-27 2.1 OLAP 和数据仓库 15-19 2.1.1 OLAP 的基本概念和特点 15-16 2.1.2 OLAP 和OLTP 16-17 2.1.3 数据仓库的定义和特点 17-19 2.2 数据挖掘 19-20 2.2.1 数据挖掘的定义 19 2.2.2 数据挖掘和OLAP、数据仓库 19-20 2.3 研究及应用现状 20-27 2.3.1 OLAP 技术 20-22 2.3.2 数据仓库应用 22-24 2.3.3 数据挖掘方法 24-25 2.3.4 审计软件 25-27 第3章 辅助审计的数据仓库的总体框架 27-35 3.1 系统总体框架设计 27-29 3.2 数据准备模块 29-33 3.2.1 数据采集子模块 29-30 3.2.2 数据预处理子模块 30-33 3.3 数据挖掘模块 33-35 第4章 数据准备模块的设计与实现 35-45 4.1 设计思想来源 35-36 4.2 实现思路 36-37 4.3 主要功能的实现 37-45 4.3.1 数据字典管理 37 4.3.2 数据处理规则建模 37-39 4.3.3 配置和生成SQL 语句 39-41 4.3.4 执行过程并生成日志 41-42 4.3.5 视图与模型同步 42-45 第5章 辅助审计的数据挖掘处理模型的设计与实现 45-53 5.1 模型的设计 45-46 5.2 模型的实现 46-51 5.2.1 转换数据模式 46-48 5.2.2 评价数据获取评价值 48-49 5.2.3 对评价值的聚类分析 49 5.2.4 分析结果并发现规则 49-51 5.2.5 验证规则和反查“孤立点” 51 5.3 本章小结 51-53 第6章 相关聚类算法的研究与改进 53-76 6.1 聚类算法概述 53-57 6.1.1 聚类的定义和要求 53-55 6.1.2 聚类算法的典型分类 55-56 6.1.3 孤立点检测和分析 56-57 6.2 一种基于互连通性的网格密度聚类算法——LBCG 算法 57-66 6.2.1 算法思想来源 57-59 6.2.2 相关概念 59-60 6.2.3 算法思想 60-61 6.2.4 算法实现 61-64 6.2.5 时间、空间复杂度分析 64 6.2.6 实验结果分析 64-66 6.3 基于划分的层次聚类算法——K-CURE 算法 66-74 6.3.1 CURE 算法的思想 66-67 6.3.2 算法思想 67-69 6.3.3 算法实现 69-71 6.3.4 孤立点剔除时机选择 71-72 6.3.5 时间、空间复杂度分析 72-73 6.3.6 实验结果分析 73-74 6.4 本章小结 74-76 第7章 原型系统简介 76-82 7.1 运行环境 76 7.2 数据采集子模块主要功能演示 76-78 7.3 数据清洗部分主要功能演示 78-80 7.4 数据转换部分主要功能演示 80 7.5 数据挖掘模块主要功能演示 80-82 第8章 结束语 82-84 8.1 主要工作及特色 82-83 8.2 进一步研究方向 83-84 参考文献 84-90 攻读硕士学位期间公开发表的论文 90-91 致谢 91-92 详细摘要 92-95
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 公司治理对审计质量影响的实证研究,F224
- A证券公司财务控制问题研究,F830.42
- 审计服务经济发展问题研究,F239.4
- 鄱阳湖生态经济区建设中的民生审计问题,F239.4
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|