学位论文 > 优秀研究生学位论文题录展示

球谐函数展开快速算法及其并行算法研究

作 者: 王翔
导 师: 宋君强
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 球谐函数展开 并行算法 GPU通用计算 CULA MPI+CUDA
分类号: TP301.6
类 型: 硕士论文
年 份: 2011年
下 载: 94次
引 用: 0次
阅 读: 论文下载
 

内容摘要


计算机技术的迅速发展促进了数值天气预报模式的不断推进,并使偏微分方程离散化相关的数值方法变得更加完善和精确,从而减小了求偏微分方程数值解的误差。谱变换方法采用球谐函数的有限截断展开来逼近球面某垂直层上的状态变量,充分利用变量在物理空间和谱空间之间的适当变换,有效降低偏微分方程中以非线性项为主的计算量,进而获得高精度的计算解。其中物理空间由状态变量在经纬度格点的直积组成,谱空间由状态变量对应的截断球谐函数展开系数组成。谱模式具有精度高、稳定性好等优点,但其运算量和存储量较大。球谐函数展开作为一种数学方法,被广泛应用于数值天气预报模式、地球物理、化学物理、偏微分方程数值解等众多领域。球谐函数是球面纬向微分算子以及球面Laplace算子的特征函数。基于球谐函数的谱变换,是谱模式计算中的核心问题,涉及Fourier变换和Legendre变换,其中Fourier变换应用于经度方向,Legendre变换应用于纬度方向。本文基于Rokhlin-Tygert球谐函数展开快速算法,深入研究了算法的并行化问题,主要内容包括:(1)分析数值天气预报谱模式以及球谐函数的特点,研究了并行计算理论和技术,包括MPI并行、CUDA并行、MPI+CUDA异构并行;(2)深入研究并补充完善了Rokhlin-Tygert球谐函数展开快速算法,增加了0阶标准Legendre多项式展开系数的计算步骤;(3)针对球谐函数展开快速算法,设计了RT并行算法;(4)实现了RT算法的MPI并行程序,并分别在某五万亿次集群和“天河一号”超级计算机上进行测试,其结果均显示:在三角截断波数M ? 1023时,并行效率可达87%以上;(5)实现了RT算法的MPI+CUDA异构并行程序,调用了CULA库函数。“天河一号”上的实验结果显示:CUDA的加速效果在M ? 1023时逐渐显著,单节点双进程布局的并行效率随M的增大而增长并超过单节点单进程;在M ?4095时,使用512节点1024进程可获得超过6700的加速比。

全文目录


相似论文

  1. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  2. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  3. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  4. 基于FP-Growth关联规则的并行算法分析及其应用研究,TP311.13
  5. 快速智能入侵检测技术研究,TP393.08
  6. 基于GPU图像搜索中文本检索的关键技术研究,TP391.1
  7. GPU加速的仿射算术在几何设计中的应用研究,TP391.41
  8. GPS掩星资料处理的GPU并行算法研究,TP391.41
  9. 基于GPU的程序分析与并行化研究,TP332
  10. 基于多核平台椭圆曲线密码算法和AES算法的并行化研究,TN918.1
  11. 并行支持向量机算法研究,TP181
  12. 基于GPU的H.264到AVS视频转码并行设计,TN919.81
  13. 一种并行分层聚类算法的研究和实现,TP301.6
  14. 异构机群系统上多目标和多模式近似串匹配并行算法研究,TP393.01
  15. 多视角立体视频编解码的关键技术研究,TN919.81
  16. 基于多核环境的并行下载系统研究开发,TP393.093
  17. 一种基于自适应迁移策略的并行遗传算法,TP18
  18. 打包机整体结构系统动态特性研究,TB486
  19. 倒向随机微分方程高精度数值方法,O211.63
  20. 基于图形处理器的合成孔径雷达成像算法,TN958

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com