学位论文 > 优秀研究生学位论文题录展示
GRAPES全球模式MPI+OpenMP混合并行方法
作 者: 蒋沁谷
导 师: 金之雁
学 校: 中国气象科学研究院
专 业: 气象学
关键词: MPI OpenMP 数值天气预报模式 区域分解 混合并行
分类号: TP38
类 型: 硕士论文
年 份: 2014年
下 载: 3次
引 用: 0次
阅 读: 论文下载
内容摘要
近几年来随着多核计算技术的发展,基于多核处理器的集群系统逐渐成为高性能计算机市场主流架构。高性能计算机的计算核数不断增加,同时计算性能保持一定的年增长速度增长。作为高性能计算的重要应用,气象数值模式预报准确率的提高很大程度上得益于分辨率的提高,使得模式能够模拟更加真实的物理动力过程。但模式分辨率的提高意味着计算量的成倍增长。为适应目前既有分布又有共享内存的硬件体系架构以及解决分辨率提高带来的计算量增长问题,可以使用MPI+OpenMP混合编程模型,实现集群节点间和节点内两级并行,利用消息传递与共享并行处理两种编程方式优点,MPI用于结点间通信,OpenMP用于结点内并行计算,提高模式的并行度。本文采用MPI+OpenMP混合并行模型,使用区域分解并行和循环并行两种方法,对GRAPES全球模式进行混合并行方案设计和优化。具体混合并行原则是对于计算量均匀分布,同时线程安全的格点计算使用tile并行,tile并行使用一维纬向tile划分。对于计算量不均匀的格点计算、程序内部线程不安全或存在MPI通信以及有负载平衡问题的物理过程,则选择循环并行方法。本文分别使用分辨率为1°和0.25°的数据对GRAPES混合并行方法试验。实验结果表明,混合并行方法可以在MPI并行的基础上提高模式的并行度,在计算核数相同的情况下,4个线程内的MPI+OpenMP混合并行方法比纯MPI方法效果好,但在线程数量大于4时,并行效果显著下降。当纯MPI方法因扩展性限制不能运行时,MPI+OpenMP混合并行方法可以替代它,获得比纯MPI方法更好的扩展性。GRAPES全球模式混合并行方法在大规模并行情况仍能保持较高的并行效率。研究表明,MPI+OpenMP混合并行方法适合GRAPES全球模式。
|
全文目录
摘要 4-5 Abstract 5-7 目录 7-9 第一章 绪论 9-19 1.1 引言 9-15 1.1.1 高性能计算机发展 9-14 1.1.2 数值模式发展 14-15 1.2 国内外研究进展 15-16 1.3 研究内容 16 1.4 研究意义 16-17 1.5 论文结构安排 17-19 第二章 MPI+OpenMP 混合并行模型 19-25 2.1 MPI 19 2.2 OpenMP 19-20 2.2.1 OpenMP 执行模型 20 2.2.2 OpenMP 存储模型 20 2.3 MPI+OpenMP 混合并行模型 20-23 2.3.1 混合并行模型 20-22 2.3.2 混合并行模型优点 22-23 2.4 本章小结 23-25 第三章 GRAPES 全球模式混合并行方案 25-33 3.1 GRAPES 现有并行方案 25-26 3.2 GRAPES 混合并行方案 26-29 3.2.1 tile 并行 27-28 3.2.2 循环并行 28-29 3.3 tile 并行效果分析 29-30 3.4 循环并行效果分析 30-31 3.5 GRAPES 模式混合并行原则 31 3.6 本章小结 31-33 第四章 模式动力框架混合并行设计 33-41 4.1 半拉格朗日方法混合并行设计 33-35 4.1.1 混合并行设计 34 4.1.2 混合并行效果分析 34-35 4.2 Helmholtz 方程求解混合并行设计 35-40 4.2.1 GCR 算法 36-37 4.2.2 带有 ILU 预条件子的 GCR 算法 37-40 4.3 本章小结 40-41 第五章 模式主要物理过程混合并行设计 41-47 5.1 辐射过程混合并行设计 41-43 5.2 陆面过程与边界层过程混合并行设计 43-44 5.3 微物理过程混合并行设计 44-45 5.4 本章小结 45-47 第六章 试验结果和分析 47-55 6.1 试验环境 47 6.2 OpenMP 扩展性试验 47-49 6.3 积分计算混合并行整体效果及扩展性试验 49-53 6.4 本章小结 53-55 第七章 总结与讨论 55-57 7.1 总结 55 7.2 讨论和展望 55-57 参考文献 57-59 致谢 59-60 个人简介 60
|
相似论文
- 基于MPI的三维地层建模和可视化方法研究,TP391.41
- 环境一号卫星CCD影像云去除方法研究及并行化实现,P228
- 基于并行计算的医学超声成像技术研究,TP391.41
- 彩色图像的超分辨率重建与并行处理技术的研究,TP391.41
- 基于IHE的PIX研究与实现,TP399-C8
- 基于Linux的小型高性能集群的研究和优化,TP316.81
- 基于多核环境的基因贝叶斯网络构造算法研究与实现,Q75
- 多时相遥感影像变化检测并行系统设计与实现,TP751
- 过载虚机条件下MPI通信性能改善方法研究,TP302
- 基于多核计算环境的并行PHYLIP的设计与实现,TP332
- 基于MPI的并行容错技术研究与实现,TP302.8
- 球谐函数展开快速算法及其并行算法研究,TP301.6
- 基于MPI的大地电磁三维正反演并行算法研究,P631.325
- 棒材在线自动计数系统的研究,TG334.9
- 基于OpenMP的遗传退火算法的并行化,TP301.6
- 多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41
- 多层格林函数插值法的并行化研究,O441.4
- FDTD与MPSTD并行算法在电磁散射中的应用研究,O441.4
- 基于并行环境求解TSP问题,O224
- 铜带剪切线张力控制系统及应用,TG333.21
- 门控心肌灌注显像在冠状动脉搭桥术前后的临床应用研究,R654.2
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 其他计算机
© 2012 www.xueweilunwen.com
|