学位论文 > 优秀研究生学位论文题录展示
动态关联规则的研究
作 者: 陈波
导 师: 郑彦
学 校: 南京邮电大学
专 业: 计算机技术
关键词: 数据挖掘 数据入库与数据合并 关联分析 动态关联规则 行为分析
分类号: TP311.13
类 型: 硕士论文
年 份: 2012年
下 载: 30次
引 用: 0次
阅 读: 论文下载
内容摘要
随着我们收集和存储各种不同数据集的能力持续增加,对于理解和使用这些大数据的先进技术的需求也在不断增长。数据挖掘技术能为我们解决这种需求。而关联分析是其中最常用的方法。一般关联规则挖掘理论中,都是在确定的数据集上进行研究,被发现的规则也是静止的。本文在行为分析过程中对关联规则的动态变化进行研究。本文是针对网络数据进行行为分析,数据量很大,所以在数据预处理时,需要对数据库效率进行考虑。而行为分析中每条关联规则的支持度很小,在评价关联规则的时候就以关联规则的置信度为评价标准。由于数据仓库需要经常更新,已经发现的关联规则的置信度将会随着数据仓库的变化而变化。本文在描述关联规则变化中,引入了支持度计数和置信度计数等评价指标。本文的主要工作是对传统数据入库和合并与Oracle一些特性进行了效率比较,并改进了传统评价关联规则的方法,同时当数据集动态变化时,给出了挖掘动态关联规则的方法。
|
全文目录
中文摘要 4-5 ABSTRACT 5-8 第一章 绪论 8-15 1.1 引言 8-11 1.1.1 课题来源及选题的依据 8-9 1.1.2 数据挖掘技术发展背景及历史 9-10 1.1.3 数据挖掘的概念与作用 10 1.1.4 数据挖掘方法与分类 10-11 1.2 关联规则挖掘 11 1.3 关联规则研究现状 11-14 1.3.1 概念问题 12-13 1.3.2 实现问题 13-14 1.3.3 应用问题 14 1.4 本文主要内容 14-15 第二章 数据库优化 15-26 2.1 引言 15-16 2.2 外部表 16-20 2.2.1 外部表概述 16 2.2.2 数据访问驱动 16-17 2.2.3 使用外部表进行数据加载 17 2.2.4 外部表的并行访问 17 2.2.5 外部表管理 17-18 2.2.6 外部表的实例 18-20 2.3 Merge into 详细介绍 20 2.4 实验分析与讨论 20-25 2.4.1 实验环境 20 2.4.2 实验设计及效率评估 20-25 2.5 小结 25-26 第三章 关联分析的基本概念 26-44 3.1 引言 26-27 3.2 关联规则的基本概念 27-28 3.3 关联规则发现 28-40 3.3.1 频繁项集产生 29-30 3.3.2 先验原理 30-32 3.3.3 Apriori 算法的频繁项集产生 32-35 3.3.4 候选项集的产生与剪枝 35-38 3.3.5 支持度计数 38-40 3.4 规则产生 40-43 3.4.1 基于置信度的剪枝 40 3.4.2 Apriori 算法中规则的产生 40-43 3.6 小结 43-44 第四章 动态关联规则 44-53 4.1 引言 44 4.2 相关研究 44-48 4.2.1 序列模式 44-46 4.2.2 非频繁模式 46-48 4.3 动态关联规则的定义和相关问题的讨论 48-51 4.3.1 动态关联规则的定义 48-50 4.3.2 动态关联规则与普通关联规则的比较 50 4.3.3 实例说明 50-51 4.4 小结 51-53 第五章 动态关联规则在行为分析中的应用 53-57 5.1 引言 53 5.2 行为分析系统结构介绍 53-54 5.3 实验 54-57 第六章 结束语 57-58 6.1 论文总结 57 6.2 展望 57-58 致谢 58-59 图表清单 59-61 参考文献 61-65
|
相似论文
- 外来入侵植物加拿大一枝黄花对入侵地土壤动物群落结构的影响,S451
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 粳稻穗角性状的遗传分离分析和QTL定位及关联分析,S511.22
- 作物品种群体抗性性状基因座定位的新方法研究,S336
- 曲靖清香型烤烟风格形成的土壤因素和烟叶品质特点分析,S572
- 中国大豆地方品种群体的遗传结构和连锁不平衡特征及主要育种性状QTL的关联分析,S565.1
- 中国野生大豆的群体结构和连锁不平衡特点以及育种有关性状QTL的关联分析,S565.1
- 陆地棉雄蕊发育耐高温种质资源筛选及农艺性状与SSR标记关联分析,S562
- 我国栽培大豆品种的遗传多样性分析与青籽粒性状QTL的关联定位,S565.1
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 小麦抗赤霉病Qfhs-3B近等基因系的选育、精确定位及关联分析,S512.1
- 大豆栽培品种群体粒形性状及百粒重的关联分析,S565.1
- 大豆栽培品种主要农艺性状与SSR标记的关联分析,S565.1
- 大豆产量、品质性状与SSR标记的关联分析,S565.1
- 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
- 小麦蛋白磷酸酶TaPP2Aa/c的功能标记开发、作图和关联分析,S512.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|