学位论文 > 优秀研究生学位论文题录展示
可扩展数据驱动并行算法研究及应用
作 者: 张爱清
导 师: 莫则尧
学 校: 中国工程物理研究院
专 业: 计算数学
关键词: 有向图 并行计算模型 并行算法 粒子输运方程
分类号: O246
类 型: 博士论文
年 份: 2009年
下 载: 137次
引 用: 1次
阅 读: 论文下载
内容摘要
在高性能科学计算中,计算区域通常被离散成网格,微分方程在网格上由计算方法离散。从相邻网格间数据依赖关系的角度,计算方法可以分为两种类型:无向数据依赖和有向数据依赖。对于前者,网格单元的计算可以通过引用相邻网格单元的已知量而独立进行;对于后者,网格单元的计算依赖于某些相邻网格单元的最新计算结果,也就是说,只有所有这些相邻网格单元计算完毕,才能开始该网格单元的计算。对无向数据依赖的计算方法,计算区域可以分解为多个子区域并分配到不同处理器中,高效并行算法可以按粗粒度的BSP模型进行设计。但是,对有向数据依赖的计算方法,这种并行算法设计模式无法适应,需要考虑细粒度的并行计算模型和相应的并行算法。细粒度的并行计算对并行机的通信延迟提出了很高的要求,但是,随着现代高性能计算机的快速发展,处理器间的通信延迟可以降低到几个微秒,这使得细粒度的高效有向数据依赖并行算法的设计成为可能。本文以求解粒子输运方程的离散纵标(S_N)计算方法及其它若干有向数据依赖关系计算方法为背景,围绕刻画有向数据依赖关系的并行计算模型、基于模型的通用并行算法、并行算法的性能优化、并行算法的实际应用等方面进行了系统深入的研究,取得如下主要研究成果:(一)通过分析典型科学计算应用计算方法的有向数据依赖关系,基于有向图,归纳总结并提出了一种刻画有向数据依赖关系的数据驱动并行计算模型,将计算方法的并行计算问题等价地转化为模型的并行计算问题。(二)针对数据驱动并行计算模型,提出了统一形式的数据驱动并行算法,以及相应的性能评价方法。该算法由三部分组成:有向图剖分、结点优先级策略和并行流水线算法。(三)针对二维辐射输运问题,实现具体的数据驱动并行算法,通过对程序LARED-R-1的并行化,在上百个处理器上,取得了可扩展的并行性能。(四)针对数据驱动并行算法,提出一种具有普适性的新的结点优先级策略,可用于充分挖掘并行度。理论证明和实际应用表明,该策略在数百个处理器上效果明显。(五)针对并行自适应结构网格应用支撑软件框架(JASMIN),提出并实现了适合数据驱动并行算法的三层软件体系结构。该体系结构大幅降低了有向数据依赖关系计算方法并行程序的研制难度。并且2048个处理器上的性能测试表明,这种实现是相当有效的。
|
全文目录
摘要 4-6 Abstract 6-11 第一章 绪论 11-19 1.1 研究背景与意义 11-13 1.2 研究动态 13-15 1.3 论文主要贡献 15-16 1.4 论文组织结构 16-17 1.5 预备知识、相关记号和术语 17-18 1.6 本文计算环境 18-19 第二章 数据驱动计算模型 19-29 2.1 数据驱动计算模型 19-22 2.1.1 定义 19-20 2.1.2 可计算条件 20 2.1.3 基于模型的数据驱动串行计算 20-22 2.2 数据驱动计算建模 22-27 2.2.1 从实际应用中抽取有向图 22-26 2.2.2 有向数据依赖关系应用计算与数据驱动计算的等价关系 26-27 2.3 模型分类 27-28 2.4 小结 28-29 第三章 数据驱动并行算法 29-41 3.1 概述 29-30 3.2 有向图剖分 30-31 3.2.1 P-路图剖分 30 3.2.2 P-路图剖分到处理器的映射 30-31 3.2.3 有向图剖分算法 31 3.3 结点优先级策略 31-34 3.3.1 最优调度问题 32-33 3.3.2 优先级策略介绍 33-34 3.4 并行流水线算法 34-39 3.4.1 并行流水线算法 34-37 3.4.2 并行流水线算法终止条件 37-39 3.5 小结 39-41 第四章 数据驱动并行算法性能评价 41-45 4.1 算法评价准则 41-43 4.1.1 理想加速比 41-42 4.1.2 算法加速比 42 4.1.3 实测加速比 42-43 4.2 关键性能因素 43-44 4.2.1 通信延迟 43 4.2.2 结点粒度 43-44 4.3 小结 44-45 第五章 在辐射输运计算中的应用 45-55 5.1 LARED-R-1程序介绍 45-48 5.1.1 辐射输运方程 45-46 5.1.2 数值方法 46-48 5.2 并行实现方案 48 5.3 通量扫描并行计算 48-51 5.3.1 数据驱动计算模型 48-49 5.3.2 有向图剖分 49 5.3.3 优先级策略 49-50 5.3.4 并行流水线算法 50-51 5.4 数值实验 51-53 5.4.1 并行流水线性能 51-52 5.4.2 整体并行性能 52-53 5.5 小结 53-55 第六章 一种新的结点优先级策略 55-69 6.1 新的优先级策略CAP-FB 55-60 6.1.1 顺逆交替迭代技术 55-56 6.1.2 截弧优先策略 56-57 6.1.3 算法流程与示例 57-60 6.2 算法并行实现 60-61 6.3 算法收敛性证明 61-63 6.4 数值实验 63-67 6.4.1 模型案例测试 63-65 6.4.2 实际应用测试 65-67 6.5 小结 67-69 第七章 JASMIN框架中数据驱动并行算法实现 69-83 7.1 面向JASMIN框架的设计思想 69-71 7.2 在JASMIN框架中的实现 71-77 7.2.1 数据驱动并行计算模块 71-73 7.2.2 扫描构件模块 73-77 7.3 基于框架的应用示例 77-81 7.3.1 隐式迎风格式求解中子输运方程 77-78 7.3.2 基于框架的实现 78-81 7.4 应用测试 81-82 7.4.1 串行性能 81 7.4.2 并行性能 81-82 7.5 小结 82-83 第八章 总结和展望 83-85 参考文献 85-91 完成论文 91-93 个人简历 93-95 致谢 95
|
相似论文
- 频繁图结构并行挖掘算法的研究与实现,TP311.13
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
- 工件排序问题的若干研究,O157.5
- 基于有向图的复杂事件共享检测技术研究,TP274
- GPU加速的仿射算术在几何设计中的应用研究,TP391.41
- 航空发动机燃调系统故障诊断,V263.6
- 基于GPU的H.264到AVS视频转码并行设计,TN919.81
- 基于全向图与遥感图的建筑物三维重建关键技术研究,TP391.41
- H.264并行编码算法设计及其在GPU上的实现,TP391.41
- 基于ADSPTS201S的并行信号处理系统的设计与实现,TN957.51
- 基于小波变换的图像压缩并行算法研究,TP391.41
- 基于GPU的并行蚁群优化算法的研究与实现,TP301.6
- 基于MapReduce的聚类算法的并行化研究,TP311.13
- 面向星载计算机的容错并行算法研究与实现,TP302.8
- 多下一跳快速自愈路由技术研究,TN915.02
- 激光能量沉积光路追踪法及其并行化,TN241
- 基于LBM的两相流数值模拟及其并行算法的实现,O359
- 输电网故障诊断和设备性能分析系统的研究,TM727
- 基于树形计算结构的电力系统潮流并行算法研究,TM744
- D-TIN并行构建方法及其在地图综合中的应用研究,P283
中图分类: > 数理科学和化学 > 数学 > 计算数学 > 数值并行计算
© 2012 www.xueweilunwen.com
|