学位论文 > 优秀研究生学位论文题录展示
GPU加速MapReduce集群的设计与实现
作 者: 辛淼
导 师: 王瑞
学 校: 云南大学
专 业: 计算机软件与理论
关键词: MapReduce GPU加速 并行排序 性能优化
分类号: TP338.6
类 型: 硕士论文
年 份: 2013年
下 载: 3次
引 用: 0次
阅 读: 论文下载
内容摘要
更快速的处理海量数据,是数据中心计算领域永恒的追求。随着数据量的爆炸式的增长,以及应用领域对于数据处理时效性的要求越来越高,数据处理的压力越来越大。人们不得不着手对现有的大规模数据处理的软硬件架构进行改进。MapReduce作为一种分布式并行计算模型,在企业大数据计算领域得到了广泛的应用。近年来,研究人员着手从各种角度挖掘MapReduce模型的性能潜力,其中,硬件加速的MapReduce是一种新颖的思路。在本文中,我们将介绍一种基于图形处理器(GPU)加速的MapReduce实现平台。GPU是一种高度并行的众核(many-core)处理器,它可以同时发射上千线程,显著提高计算速度。目前在高性能计算等领域,以GPU为代表的异构协处理器已经得到了广泛认可。以此为基础,我们尝试将GPU的强大计算能力与MapReduce模型在数据密集型应用方面的优势相结合,以实现一种基于GPU加速的高性能MapReduce集群。以此为中心,本文所属的课题展开了相应的研究,具体的工作和成果如下:1.设计并实现了一种基于GPU加速的MapReduce实现框架一—GAMR集群系统;2.提出了一种基于GPU的并行排序算法,并应用于GAMR集群系统中,从而将作业运行阶段的排序速度提高了3到8倍;3.详细分析了MapReduce作业的数据流,得到了一种形式化的MapReduce性能量化模型,从而使MapReduce作业的性能评估可以通过公式计算得出;4.提出了一种基于共轭梯度优化算法的自动化MapReduce集群性能优化方法,减少了集群运维人员的工作量;我们工作的核心思想是,将MapReduce模型的并行性从节点间粗粒度的多机(Multi-computer)并行,进一步延伸到节点内细粒度的众核(Many-core)并行,通过异构协处理器来提高MapReudce运行环境的性能。实验测试表明,与其他MapReduce实现环境相比,运行在GAMR集群上的MapReduce作业获得了5倍左右的加速。
|
全文目录
摘要 3-4 Abstract 4-6 目录 6-9 图表目录 9-10 第一章 绪论 10-16 1.1 研究背景 12-13 1.2 研究现状 13-14 1.3 本文的内容和文章的组织 14-16 1.3.1 本文的主要内容 14-15 1.3.2 文章的组织 15-16 第二章 相关介绍 16-28 2.1 MapReduce介绍 16-21 2.1.1 MapReduce作业运行流程的分解 18-19 2.1.2 MapReduce的具体实现 19-21 2.2 GPU通用计算技术介绍 21-28 2.2.1 GPU物理结构 23-25 2.2.2 GPU编程模型 25-28 第三章 GAMR集群系统 28-35 3.1 基本架构 28-31 3.1.1 分布式存储模块 28-29 3.1.2 计算模块 29-30 3.1.3 性能优化模块 30-31 3.2 硬件结构 31-32 3.3 作业运行流程 32-34 3.4 本章小结 34-35 第四章 GAMR集群上的GPU并行排序算法 35-46 4.1 GPU-QuickSort算法 35-38 4.2 Hyper-GPU-QSort:对GPU-QuickSort算法的改进 38-44 4.2.1 算法改进1:提高初始阶段的硬件利用率 38-40 4.2.2 算法改进2:提高最后一轮排序的效率 40-44 4.3 测试与实验结果 44-45 4.4 本章小结 45-46 第五章 GAMR集群性能模型与作业并行度优化 46-73 5.1 GAMR集群性能模型 46-67 5.1.1 Map阶段数据流与性能模型 47-56 5.1.2 Shuffle阶段数据流与性能模型 56-61 5.1.3 Reduce阶段数据流与性能模型 61-67 5.2 模型分析 67-68 5.3 GAMR作业并行度优化 68-72 5.3.1 Fletcher-Reeves共轭梯度法 69-70 5.3.2 基于共轭梯度方法的并行度优化总体框架 70-71 5.3.3 迭代终止条件 71-72 5.4 本章小结 72-73 第六章 实验测试 73-79 6.1 实验环境 73 6.2 基准测试程序 73-74 6.2.1 WordCount 74 6.2.2 K-mean 74 6.2.3 Gaussian Convolution 74 6.3 测试结果 74-78 6.3.1 分项测试 74-76 6.3.2 综合测试 76-77 6.3.3 并行度优化的有效性 77-78 6.4 本章小结 78-79 第七章 总结与展望 79-81 7.1 本文的贡献个创新点 79 7.2 下一步的研究 79-81 参考文献 81-85 致谢 85-86 作者学习期间取得的学术成果 86
|
相似论文
- 基于Map/Reduce框架的分布式日志分析系统的研究及应用,TP311.52
- 直接体绘制相关技术研究,TP391.41
- 高速网络环境下的入侵检测系统的研究,TP393.08
- 基于Hadoop的文本分类研究,TP391.1
- 基于Hadoop的分布式服务注册中心研究和实现,TP393.09
- 基于多核CPU的任务级数据处理研究及其在集群平台下的性能测试,TP274
- 数据中心Hadoop部署与追踪系统研究,TP308
- 云环境下MapReduce容错技术的研究,TP302.8
- 群体仿真算法研究及疏散仿真系统开发,TP391.9
- 一个可扩展的MapReduce原型设计与实现,TP311.52
- 基于MapReduce的分布式文本数据过滤技术研究与系统实现,TP391.1
- 基于段落指纹的大规模近似网页检测算法研究,TP393.092
- MapReduce FairScheduler的高性能优化及超大规模集群模拟器设计及实现,TP311.13
- 基于列存储的RFID数据的管理技术的研究与应用,TP315
- 高性能计算体系结构下的海量数据处理分析与优化,TP338
- 分布式系统中的信息流控制模型的研究,TP316.4
- 数据密集型计算系统中的作业调度技术研究,TP311.13
- 超大跨径CFRP缆索悬索桥力学性能分析及优化设计,U448.25
- 基于IaaS云计算的Web应用技术研究,TP393.09
- 云计算中MapReduce性能优化及应用,TP3
- 基于MapReduce的聚类算法的并行化研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com
|