学位论文 > 优秀研究生学位论文题录展示
数据挖掘在电子政务办公系统中的应用
作 者: 袁峻
导 师: 曾大聃
学 校: 华东师范大学
专 业: 软件工程
关键词: 电子政务 数据挖掘 决策树 聚类
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 149次
引 用: 0次
阅 读: 论文下载
内容摘要
电子政务近年来在中国有了很大发展,各级政府部门建立了大量的数据库,数据呈指数级增长。如何利用新的数据分析技术高效、准确地从电子政务系统中提取有用的信息成为了一个有现实意义的问题。本文将使用数据挖掘技术对市级电子政务办公系统iGRP进行数据分析,目的是通过对iGRP电子政务办公系统进行数据挖掘来发现影响用户活跃度的属性。在数据分析过程中首先根据分析目的选择合适的目标属性和预测属性;然后从iGRP数据库中抽取、集成、清洗所选择的目标属性和预测属性;接着对数值型预测属性进行噪声处理和离散化处理;接下来使用ODM(Oracle Data Mining)的“属性重要度”功能对目标属性及其相关预测属性进行属性重要度分析,将无关的预测属性排除,以达到减少数据维度的目的;之后,对目标属性及其相关的预测属性使用ODM的O-Cluster算法进行聚类分析,为数值型目标属性找到一个合适的分裂点,根据这个分裂点将目标属性转化为二元属性;最后,使用ODM的决策树算法对目标属性进行分类挖掘并进行测试评估。本文从某市iGRP电子政务系统5个数据库中抽取了7827条数据,包含30个预测属性和2个目标属性。按上述方法对该数据集进行数据挖掘后得出如下结论:对用户活跃度影响最大的属性是“收藏数量”,其次是“发文员”和“收文员”角色。根据此结论,应进一步了解用户对“收藏文件夹”这个功能模块的需求和使用反馈,以便改进提高此功能,为用户提供更好的服务。其次,在用户培训和用户反馈调查中应更加关注具有“发文员”和“收文员”角色的用户。本文使用数据挖掘技术对真实的电子政务系统数据进行了数据分析,实现了对海量数据的高效、准确分析,为改进iGRP产品及提高用户满意度提供了依据。
|
全文目录
摘要 6-7 ABSTRACT 7-11 第1章 绪论 11-13 1.1 背景 11-12 1.1.1 电子政务背景 11 1.1.2 数据挖掘背景 11-12 1.2 目的 12 1.3 论文结构 12-13 第2章 IGRP电子政务办公系统 13-27 2.1 电子政务简介 13-15 2.2 IGRP电子政务办公系统简介 15-16 2.3 IGRP系统设计简介 16-19 2.4 IGRP功能介绍 19-27 第3章 数据挖掘及ORACLE DATA MINING 27-47 3.1 数据挖掘 27-37 3.2 ORACLE DATA MINING 37-47 3.2.1 ODM功能简介 37-39 3.2.2 ODM的分类算法 39-44 3.2.3 ODM的聚类算法O-Cluster 44-47 第4章 对IGRP的数据挖掘规划及数据预处理 47-63 4.1 问题的提出 47 4.2 解决问题的技术途径 47 4.3 目标属性的确定 47-48 4.4 预测属性的选取 48-50 4.5 数据预处理 50-63 第5章 对"月均登录次数"的数据挖掘实现 63-76 5.1 "月均登录次数"的相关预测属性重要度分析 63-65 5.2 将"月均登录次数"转换为二元属性 65-67 5.3 使用决策树对"月均登录次数"进行分类 67-71 5.4 "月均登录次数"决策树模型的评估 71-76 第6章 对"月均公文处理次数"的数据挖掘实现 76-88 6.1 "月均公文处理次数"的相关预测属性重要度分析 76-78 6.2 将"月均公文处理次数"转换为二元属性 78-80 6.3 使用决策树对"月均公文处理次数"进行分类 80-84 6.4 "月均公文处理次数"决策树模型的评估 84-88 第7章 结束语 88-90 7.1 主要结论 88-89 7.2 展望 89-90 参考文献 90-93 致谢 93
|
相似论文
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 图像分割中阴影去除算法的研究,TP391.41
- 基于图分割的文本提取方法研究,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- K-均值聚类算法的研究与改进,TP311.13
- 大学生综合素质测评研究,G645.5
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- 南通市农业面源污染负荷研究与综合评价,X592
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 大豆杂种优势及其遗传基础研究,S565.1
- 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|