学位论文 > 优秀研究生学位论文题录展示

并行Apriori算法的性能优化技术研究

作 者: 徐志侠
导 师: 叶允明
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 关联规则挖掘 Apriori 并行 优化
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 93次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算机和互联网技术的不断发展及在各行业中的广泛使用,人们积累的各种数据成爆炸式增长,如何有效利用这些数据,是目前所面临的重大挑战。而企业往往也需要从大量的数据中挖掘和分析,得出准确有用的信息,这使得关联规则挖掘算法尤为重要。传统的并行Apriori关联规则算法在解决这类问题时由于存在着一些固有缺陷,因此效果表现不佳,而本文主要研究并行Apriori算法的性能优化技术。本文对传统的串并行Apriori算法进行深入分析,重点研究并行算法在逻辑流程方面和物理实现方面的优化技术,取得了以下几个方面的研究成果:1.提出关于并行算法逻辑流程的优化技术。通过研究当前并行算法的逻辑流程,给出了解决候选集过大和负载不均这两个缺陷的优化技术,并结合Trie树存储结构,给出了规则生成优化技术。实验结果表明,这些优化技术能够有效地减少候选集数量和减少负载不均情况,并提高规则生成效率。2.提出关于并行算法物理实现的优化技术。通过研究当前并行算法的物理实现,给出了解决数据库扫描次数过多缺陷的优化技术,并结合Trie树存储结构,给出了适应Trie树的内存分配优化技术。实验结果表明,这些优化技术能够有效地减少数据库扫描次数和提高内存利用率。基于上述研究成果,本文设计了并行Apriori算法规则挖掘系统。系统包括数据库模块,负载平衡模块,规则挖掘模块和规则生成模块等,能够有效地分析挖掘出所需的关联规则,为相关优化技术的实验和研究提供了一个基本的平台。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-19
  1.1 课题研究背景和意义  8-9
  1.2 国内外相关研究和综述  9-15
    1.2.1 串行关联规则算法研究现状  9-11
    1.2.2 并行关联规则算法研究现状  11-15
  1.3 课题研究内容  15-17
    1.3.1 并行Apriori算法的逻辑流程优化  15-17
    1.3.2 并行Apriori算法的物理实现优化  17
  1.4 本文的结构安排  17-19
第2章 Apriori算法的基本概念  19-33
  2.1 关联规则挖掘基本概念  19-24
    2.1.1 关联规则挖掘基本概念  19
    2.1.2 关联规则挖掘基本定义  19-21
    2.1.3 串并行算法设计要点  21-24
  2.2 Apriori算法的基本概念  24-31
    2.2.1 串行Apriori算法  24-28
    2.2.2 并行Apriori算法  28-31
  2.3 并行Apriori算法的优缺点与问题  31-33
第3章 并行Apriori算法的逻辑流程优化  33-48
  3.1 引言  33
  3.2 候选集生成优化  33-36
  3.3 负载平衡优化  36-39
  3.4 规则生成优化  39-41
  3.5 实验与分析  41-48
    3.5.1 实验运行环境  41
    3.5.2 实验数据描述  41-43
    3.5.3 算法评价指标  43
    3.5.4 实验结果分析  43-48
第4章 并行Apriori算法的物理实现优化  48-64
  4.1 引言  48
  4.2 数据库扫描优化  48-54
    4.2.1 数据库分块扫描优化技术  49-52
    4.2.2 数据库压缩优化技术  52-54
  4.3 数据存储结构优化  54-59
  4.4 内存分配优化  59-61
  4.5 实验与分析  61-64
    4.5.1 实验数据描述  61
    4.5.2 算法评价标准  61-62
    4.5.3 实验结果分析  62-64
第5章 基于并行Apriori算法的关联规则挖掘系统  64-73
  5.1 引言  64
  5.2 系统的功能与目标  64-65
  5.3 系统总体设计  65-66
    5.3.1 系统原理  65
    5.3.2 系统总体架构  65-66
  5.4 系统详细设计  66-69
    5.4.1 数据库模块  66-67
    5.4.2 预处理模块  67
    5.4.3 负载平衡模块  67-68
    5.4.4 频繁集抽取模块  68-69
    5.4.5 规则生成模块  69
    5.4.6 前台展示模块  69
  5.5 系统展示  69-73
结论  73-76
参考文献  76-81
致谢  81

相似论文

  1. 超声波钎焊填缝及钎缝优化工艺研究,TG454
  2. 曲拉精制干酪素褐变因素及工艺优化研究,TS252.5
  3. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  4. 常温低温组合密封结构的有限元分析与优化设计,TH136
  5. 涡轮S2流面正问题气动优化设计研究,V235.11
  6. 基于蚁群算法的电梯群优化控制研究,TU857
  7. 中心回燃式燃烧室燃烧特性研究,TK223.21
  8. 内置式高效永磁同步电机的设计研究,TM341
  9. 内点法在大型电力系统无功优化中的应用研究,TM714.3
  10. 轴向磁通感应子式高温超导电机的基础研究,TM37
  11. AVS视频解码器在PC平台上的优化及场解码的改善,TN919.81
  12. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  13. AES算法及其DSP实现,TN918.1
  14. 多层卫星网络稳定性设计研究,TN927.23
  15. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  16. 海量多数据库集成系统的查询处理研究,TP311.13
  17. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  18. 大规模计算环境下网络模拟任务划分研究,TP393.01
  19. 米曲霉FS-1脂肪酶发酵优化、分离纯化与酶学特性的研究,TQ925.6
  20. 大红山铁矿井下人员跟踪定位系统的优化研究,TN929.5
  21. 基于粒子群算法求曲线/曲面间最小距离方法,O182

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com