学位论文 > 优秀研究生学位论文题录展示
基于数据仓库和数据挖掘的行为分析研究
作 者: 杨雅薇
导 师: 张卫钢
学 校: 长安大学
专 业: 计算机软件与理论
关键词: 信息应用 行为分析 数据仓库 数据挖掘
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 185次
引 用: 1次
阅 读: 论文下载
内容摘要
行为分析是一种特殊的社会网络分析,其目的是为国家司法(执法)部门从事案件侦查、预防和打击违法犯罪提供有效的情报信息。利用数据仓库和数据挖掘技术从看似杂乱无序的各种海量信息中发现知识,进行行为分析和特征描述,研究其中的规律和联系,从而产生情报信息并服务实战,具有相当重要的现实意义。目前,各行各业的信息和数据大多自成体系,相互独立,联合应用有一定困难,限制了情报信息的分析和获取,因此,设计了行为分析数据仓库模型,利用星型模型构建数据仓库,用关系模型存放数据,合理组织和管理数据,构建了一个可以实现跨行业跨领域、整合各类信息的数据仓库。利用OLAP动作提供多维数据,实现了行为分析的基础功能查询和比对,为情报分析人员提供辅助决策的数据信息支持。利用ID3算法实现对行为数据的分类,发现行为属性的特征模式,引入经验参考系数δ对算法进行改进。利用Apriori算法对特征属性与事件关联关系和行为特征属性问的关联关系进行挖掘研究,发现关联规则。利用概念分类的聚类思想,使用概率和频率度量对行为数据分类,获得指导情报分析的模型。应用上述研究成果于实际案例,可以实现行为分析的最终目标,即产生情报信息用来指导侦查破案。A城统计结果表明,试用行为分析后一个季度情报线索的自主发现率(非举报、报案)环比提高了11%。利用数据仓库和数据挖掘进行行为分析,可以有效拓宽情报信息的获取途径和方法,达到了研究的预期效果,有较高的实用价值。
|
全文目录
摘要 5-6 Abstract 6-9 第一章 绪论 9-12 1.1 研究背景和意义 9-10 1.2 国内外研究现状 10-11 1.3 论文研究主要内容 11-12 第二章 数据仓库与数据挖掘 12-23 2.1 数据仓库的基本原理 12-17 2.1.1 数据仓库的概念与特点 12-14 2.1.2 数据仓库的体系结构 14-16 2.1.3 数据仓库的构建策略 16-17 2.2 数据挖掘技术 17-21 2.2.1 数据挖掘的概念 17-18 2.2.2 数据挖掘的过程 18-19 2.2.3 数据挖掘的功能和方法 19-21 2.3 数据仓库与数据挖掘的联系 21-22 2.4 本章小结 22-23 第三章 行为分析数据仓库的设计与应用 23-46 3.1 数据仓库规划 23-26 3.1.1 需求分析 23 3.1.2 总体设计 23-25 3.1.3 系统架构设计 25-26 3.2 模型设计 26-32 3.2.1 概念模型 26-27 3.2.2 逻辑模型 27-30 3.2.3 物理模型 30-32 3.3 数据管理 32-36 3.3.1 数据来源 32-33 3.3.2 元数据管理 33-34 3.3.3 数据采集 34-36 3.4 数据仓库应用研究 36-45 3.4.1 OLAP分析 36-41 3.4.2 综合查询 41-43 3.4.3 自动比对 43-44 3.4.4 应用环节 44-45 3.5 本章小结 45-46 第四章 行为分析挖掘及应用研究 46-67 4.1 决策树的研究及应用 46-54 4.1.1 方法分析 46-47 4.1.2 ID3算法的实现 47-49 4.1.3 模型应用 49-52 4.1.4 ID3算法的改进 52-54 4.2 关联挖掘研究 54-59 4.2.1 算法分析 54-56 4.2.2 应用研究 56-59 4.2.3 算法改进 59 4.3 聚类挖掘研究 59-63 4.3.1 方法分析 59-61 4.3.2 聚类应用 61-63 4.4 案例应用 63-66 4.5 本章小结 66-67 第五章 结论与展望 67-69 5.1 结论 67 5.2 展望 67-69 参考文献 69-71 攻读学位期间取得的研究成果 71-72 致谢 72
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 家校互动教育平台中数据仓库的研究与应用,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|