学位论文 > 优秀研究生学位论文题录展示
并行Apriori算法的性能优化技术研究
作 者: 徐志侠
导 师: 叶允明
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 关联规则挖掘 Apriori 并行 优化
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 93次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机和互联网技术的不断发展及在各行业中的广泛使用,人们积累的各种数据成爆炸式增长,如何有效利用这些数据,是目前所面临的重大挑战。而企业往往也需要从大量的数据中挖掘和分析,得出准确有用的信息,这使得关联规则挖掘算法尤为重要。传统的并行Apriori关联规则算法在解决这类问题时由于存在着一些固有缺陷,因此效果表现不佳,而本文主要研究并行Apriori算法的性能优化技术。本文对传统的串并行Apriori算法进行深入分析,重点研究并行算法在逻辑流程方面和物理实现方面的优化技术,取得了以下几个方面的研究成果:1.提出关于并行算法逻辑流程的优化技术。通过研究当前并行算法的逻辑流程,给出了解决候选集过大和负载不均这两个缺陷的优化技术,并结合Trie树存储结构,给出了规则生成优化技术。实验结果表明,这些优化技术能够有效地减少候选集数量和减少负载不均情况,并提高规则生成效率。2.提出关于并行算法物理实现的优化技术。通过研究当前并行算法的物理实现,给出了解决数据库扫描次数过多缺陷的优化技术,并结合Trie树存储结构,给出了适应Trie树的内存分配优化技术。实验结果表明,这些优化技术能够有效地减少数据库扫描次数和提高内存利用率。基于上述研究成果,本文设计了并行Apriori算法规则挖掘系统。系统包括数据库模块,负载平衡模块,规则挖掘模块和规则生成模块等,能够有效地分析挖掘出所需的关联规则,为相关优化技术的实验和研究提供了一个基本的平台。
|
全文目录
摘要 4-5 Abstract 5-8 第1章 绪论 8-19 1.1 课题研究背景和意义 8-9 1.2 国内外相关研究和综述 9-15 1.2.1 串行关联规则算法研究现状 9-11 1.2.2 并行关联规则算法研究现状 11-15 1.3 课题研究内容 15-17 1.3.1 并行Apriori算法的逻辑流程优化 15-17 1.3.2 并行Apriori算法的物理实现优化 17 1.4 本文的结构安排 17-19 第2章 Apriori算法的基本概念 19-33 2.1 关联规则挖掘基本概念 19-24 2.1.1 关联规则挖掘基本概念 19 2.1.2 关联规则挖掘基本定义 19-21 2.1.3 串并行算法设计要点 21-24 2.2 Apriori算法的基本概念 24-31 2.2.1 串行Apriori算法 24-28 2.2.2 并行Apriori算法 28-31 2.3 并行Apriori算法的优缺点与问题 31-33 第3章 并行Apriori算法的逻辑流程优化 33-48 3.1 引言 33 3.2 候选集生成优化 33-36 3.3 负载平衡优化 36-39 3.4 规则生成优化 39-41 3.5 实验与分析 41-48 3.5.1 实验运行环境 41 3.5.2 实验数据描述 41-43 3.5.3 算法评价指标 43 3.5.4 实验结果分析 43-48 第4章 并行Apriori算法的物理实现优化 48-64 4.1 引言 48 4.2 数据库扫描优化 48-54 4.2.1 数据库分块扫描优化技术 49-52 4.2.2 数据库压缩优化技术 52-54 4.3 数据存储结构优化 54-59 4.4 内存分配优化 59-61 4.5 实验与分析 61-64 4.5.1 实验数据描述 61 4.5.2 算法评价标准 61-62 4.5.3 实验结果分析 62-64 第5章 基于并行Apriori算法的关联规则挖掘系统 64-73 5.1 引言 64 5.2 系统的功能与目标 64-65 5.3 系统总体设计 65-66 5.3.1 系统原理 65 5.3.2 系统总体架构 65-66 5.4 系统详细设计 66-69 5.4.1 数据库模块 66-67 5.4.2 预处理模块 67 5.4.3 负载平衡模块 67-68 5.4.4 频繁集抽取模块 68-69 5.4.5 规则生成模块 69 5.4.6 前台展示模块 69 5.5 系统展示 69-73 结论 73-76 参考文献 76-81 致谢 81
|
相似论文
- 超声波钎焊填缝及钎缝优化工艺研究,TG454
- 曲拉精制干酪素褐变因素及工艺优化研究,TS252.5
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 常温低温组合密封结构的有限元分析与优化设计,TH136
- 涡轮S2流面正问题气动优化设计研究,V235.11
- 基于蚁群算法的电梯群优化控制研究,TU857
- 中心回燃式燃烧室燃烧特性研究,TK223.21
- 内置式高效永磁同步电机的设计研究,TM341
- 内点法在大型电力系统无功优化中的应用研究,TM714.3
- 轴向磁通感应子式高温超导电机的基础研究,TM37
- AVS视频解码器在PC平台上的优化及场解码的改善,TN919.81
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- AES算法及其DSP实现,TN918.1
- 多层卫星网络稳定性设计研究,TN927.23
- 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
- 海量多数据库集成系统的查询处理研究,TP311.13
- 频繁图结构并行挖掘算法的研究与实现,TP311.13
- 大规模计算环境下网络模拟任务划分研究,TP393.01
- 米曲霉FS-1脂肪酶发酵优化、分离纯化与酶学特性的研究,TQ925.6
- 大红山铁矿井下人员跟踪定位系统的优化研究,TN929.5
- 基于粒子群算法求曲线/曲面间最小距离方法,O182
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|