学位论文 > 优秀研究生学位论文题录展示
数据仓库与数据挖掘技术对于软件项目管理的应用
作 者: 张瑶
导 师: 姚天昉;张艳红
学 校: 上海交通大学
专 业: 软件工程
关键词: 项目管理 数据仓库 意见挖掘 关键词极性 项目意见
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 99次
引 用: 0次
阅 读: 论文下载
内容摘要
一直以来,如何提高项目的成功率被各行各业所关注,因此,项目管理也逐步地成为了一门独立的管理学科。然而,再浩大的工程最终是需要使用工具来完成的,而什么工具才能帮助项目管理提高项目的成功率?近年来,数据仓库(Data Warehouse,简称:DW)、联机分析(Online Analytical Processing,简称:OLAP)以及数据挖掘(Data Mining,简称:DM)已经在许多商业环境分析中发挥了出色的效用。数据仓库作为数据的集散地被广泛使用,有效利用这份庞大的资源体成为当前各项研究的重点课题。本文以项目管理知识体系(Project Management Bode of Knowledge,简称PMBOK[1])为背景,对项目管理进行了的描述,除将管理过程中的9大管理领域、软件项目管理活动节点以及节点上的产物详细描述之外,还结合现实项目信息,利用数据仓库存储信息,开发数据挖掘工具寻找项目中的知识——项目的意见。作者借鉴了企业资源管理系统(Enterprise Resource Planning,简称:ERP)中物料清单(Bill of Material,简称:BOM)、工作中心(Workcentre)和工艺单(Routing)的概念建立项目管理数据仓库,从候选方案中选择最佳项目管理信息资源结构的组织方式,并建立项目管理信息仓库。之后,从累积多年的项目信息中筛选、转化、加载具有代表价值的数据导入数据仓库,且形成一套完成的ETL独立工具——SSIS_DM。建立信息数据仓库后,研究重点进入对数据挖掘算法的研究。在文本意见挖掘的思路基础上研究并发展适合项目意见挖掘的算法,通过计算获得软件项目过程节点产物中的关键词及其极性,帮助抽取项目观念,即:SO-PAV算法(Project Artifact Valence,简称:SO-PAV)。其中,对于特征选择函数的比较与选择都经过了慎重地考虑,并使用事实数据加以实验说明。另外,第六章开篇部分的挖掘引擎图详细地描述了挖掘工具的工作原理、相关算法以及结果判断,直至预测分析。考虑到系统代码的标准统一性、规范性以及可扩展性,本项目相关的系统开发工作主要使用的实验开发工具是SQL SERVER 2005,.net framework的语言体系架构,外部数据源来自于ACCESS,PROJECT,EXCEL等等工具。本研究意图开立结合项目管理与数据挖掘的研究。在无论是经济危机笼罩的当下,还是经济复苏的未来,此类研究都必将是极其重要的。
|
全文目录
摘要 5-6 ABSTRACT 6-12 1 绪论 12-15 1.1 研究背景 12-13 1.2 研究内容 13 1.3 论文结构 13-15 2 项目管理 15-25 2.1 项目管理概述 15 2.2 项目管理的研究 15-16 2.3 了解项目管理体系中的九大管理领域 16-23 2.3.1 整体管理 17-18 2.3.2 范围管理 18 2.3.3 时间管理 18-19 2.3.4 成本管理 19 2.3.5 质量管理 19-20 2.3.6 人力资源管理 20 2.3.7 沟通管理 20-21 2.3.8 风险管理 21-22 2.3.9 采购管理 22-23 2.4 软件项目特有的管理过程 23-24 2.4.1 需求管理 23 2.4.2 开发管理 23 2.4.3 测试管理 23-24 2.5 项目化管理对软件工程的影响 24 2.6 国内软件项目管理呼唤先进的项目管理技术 24-25 2.7 小结 25 3 数据仓库 25-35 3.1 数据仓库的历史 26-28 3.1.1 什么是数据仓库 26 3.1.2 数据仓库的特征 26-28 3.2 数据仓库的结构 28-33 3.2.1 数据仓库的系统结构 29-30 3.2.2 理解主题 30-31 3.2.3 理解元数据 31 3.2.4 事实 31-32 3.2.5 数据分割策略 32 3.2.6 数据仓库数据模式 32-33 3.3 SSIS 信息包 33-34 3.3.1 使用SSIS 达到的效果 33-34 3.3.2 SSIS 的工作原理 34 3.4 小结 34-35 4 数据挖掘 35-43 4.1 什么是数据挖掘 36 4.2 知识发掘过程 36-37 4.3 数据挖掘系统的主要成分 37-39 4.4 挖掘什么类型的模式 39-40 4.4.1 类/概念描述:特征化和区分 39 4.4.2 挖掘频繁模式、关联和相关 39-40 4.5 数据挖掘的方法论 40 4.6 特征选择 40-41 4.7 挖掘频繁模式、关联和相关 41-43 4.7.1 频繁项集和关联规则 41-42 4.7.2 频繁模式挖掘标准 42-43 4.8 意见挖掘 43 4.9 小结 43 5 建立项目管理数据仓库 43-61 5.1 原因、目的及必要性 44 5.2 了解相关业务数据库结构 44-46 5.3 项目管理数据仓库概念模型定义 46 5.3.1 项目意见分析信息包 46 5.3.2 业务处理信息存储表 46 5.4 分析主题域 46-47 5.5 事实表和维表 47-52 5.5.1 事实表 47-48 5.5.2 维表 48-52 5.6 确定数据分割策略 52-53 5.7 关系模型定义 53-54 5.8 生成SSIS 信息包 54-60 5.9 小结 60-61 6 项目关键词意见挖掘 61-74 6.1 项目关键词意见挖掘引擎 61-63 6.1.1 重要的输入特征变量 62 6.1.2 输出变量 62-63 6.1.3 关于节点产物的层次安排 63 6.2 选取合适的数据 63 6.3 为挖掘准备数据 63-66 6.4 项目关键词意见挖掘算法 66-70 6.4.1 选择特征属性 67-68 6.4.2 寻找各节点产品与评分关联支持度 68-69 6.4.3 寻找关键词的极性 69 6.4.4 挖掘项目的意见 69-70 6.5 划分模型集 70-73 6.5.1 训练集 70-72 6.5.2 验证集 72-73 6.6 小结 73-74 7 实验和结论 74-79 7.1 系统设计 74 7.2 系统运行界面 74-75 7.3 实验结果分析 75-77 7.3.1 产品提交情况 75-76 7.3.2 绩效考核情况 76-77 7.4 小结 77-79 8 结论 79-81 8.1 研究总结 79-80 8.2 未来展望 80-81 参考文献 81-84 附录 84-86 附录A:绩效考核规则以及部分公式 84-86 致谢 86 攻读学位期间发表的学术论文目录 86
|
相似论文
- 项目管理理论在高校共青团工作中的应用研究,D297
- 职业院校顶岗实习项目管理研究,G712.4
- 基于项目管理的中等职业教育双师型教师队伍建设研究,G715.1
- 高速公路项目代建制管理模式研究,F283
- 项目管理在新品卷烟开发中的运用,F426.8
- DAB公司饮料冷柜项目运营管理问题案例研究,F426.82
- 广州动车检修基地工程项目管理研究,F532
- 电力建设企业施工管理研究,TM73
- 化工建设公司人力资源管理研究,F426.7
- 原油装车系统改造项目管理研究,F284
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 大学生创业教育项目存在的问题及对策研究,G647.38
- 我国大型体育赛事志愿服务项目管理研究,G812
- 高校图书馆编目业务外包项目管理问题研究,G254.3
- 曹妃甸重型装备厂房项目进度管理研究,TU722
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 家校互动教育平台中数据仓库的研究与应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
- 软体家具生产项目的质量管理研究,F273.2
- 东汽重建重大项目中的过程控制,F426.471
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|