学位论文 > 优秀研究生学位论文题录展示
深穿透粒子输运蒙特卡罗模拟的CPU/GPU协同算法研究
作 者: 杨博
导 师: 胡庆丰
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 深穿透粒子输运 蒙特卡罗模拟 MCNP CPU/GPU协同算法 CUDA
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 110次
引 用: 0次
阅 读: 论文下载
内容摘要
近些年,由于GPU在性能和可编程性方面都有很大提升,通用GPU计算以高性价比的优势越来越受人们关注。众多研究人员都将GPU应用于所属领域,GPU的应用领域已从早期的单一图形计算扩展到通用计算,尤其是科学计算领域。粒子输运模拟在国民经济建设和大规模科学工程计算中具有重要应用,粒子输运蒙特卡罗(Monte Carlo,简称MC)方法求解相对于确定性方法在求解某些复杂粒子输运问题时有显著的优势,但往往需要的计算量极大。CPU/GPU异构混合系统的出现为这一问题的解决带来了机遇和挑战。本文在现有粒子输运MC模拟算法的基础上,针对CPU/GPU混合异构体系结构的特点,提出了一种面向大规模异构混合系统的深穿透粒子输运MC模拟CPU/GPU协同算法,并实现了该算法与MCNP程序的整合。主要工作如下:1)提出一种基于GPU的MCNP伪随机数发生器,采用了与已有MCNP伪随机数发生器相同参数的线性同余法(LCG)来生成随机数,首先通过跳跃法快速为每个线程生成随机数种子,然后利用GPU多线程并行生成多个随机数子序列。相对运行在Intel X5670上的MCNP伪随机数发生器,本文提出的基于GPU的伪随机数发生器在NVIDIA M2050上获得了11倍加速比。2)提出一种基于GPU的深穿透粒子输运MC模拟的细粒度数据级并行算法,在MCNP中粒子输运MC模拟算法的基础上,针对GPU的计算和访存特点提出了一种基于粒子数的任务划分方法和高效并行数据结构及和归约方法。给出了几种消除分支和优化存储器的方法,有效的提高了算法在GPU上的性能。相比运行在X5670上的MCNP程序,整合了基于GPU的深穿透粒子输运MC模拟细粒度数据级并行算法的MCNP-GPU程序获得3.4的加速比。3)给出了一种针对CPU/GPU混合异构系统的深穿透粒子输运MC模拟CPU/GPU协同算法,在该算法中提出了一种异构节点内部CPU/GPU之间的启发式任务划分方法,在此基础上给出一种针对大规模异构系统的多级任务划分方法,及其与之适应的多级伪随机数发生器和层次归约算法。基于MPI计算环境和CUDA编程模型,将改进后的基于GPU的MCNP伪随机数发生器和深穿透粒子输运MC模拟CPU/GPU协同算法与MCNP整合为MCNP-Hybrid程序,在TianHe-1A的64个节点上对整合后的MCNP-Hybrid程序进行了测试,结果表明该算法具有良好性能和可扩展性。
|
全文目录
相似论文
- 基于CUDA的图像数字水印技术的研究,TP309.7
- 基于VaR模型在标准型股票基金风险评估中的应用研究,F224
- 长白山典型地区降雨分布型及洪涝灾害预测研究,P426.616
- 中子元素分析中γ射线空间角分布特征的蒙特卡罗模拟,O571.5
- 中子管中子源爆炸物检测方法研究,TL99
- 基于GPU的BLAST程序的并行计算的研究,TP338.6
- 基于GPU的医学图像体绘制算法的研究与实现,TP391.41
- 实物期权模型的研究及在中国的应用,F832.5
- CUDA技术在多节点超短期负荷预测上的应用,TM715
- GPU在车辆检测与跟踪系统中的应用研究,TP391.41
- 水稻分蘖断层图像重建加速研究,TP391.41
- 基于并行计算的立体影像密集匹配算法研究,TP391.41
- 快速智能入侵检测技术研究,TP393.08
- 基于GPU的有限元方法研究,O241.82
- 心血管系统虚拟内窥镜技术研究,TP391.41
- 基于能量最小化的腹部CT图像分割与三维可视化,TP391.41
- 供应中断情况下单源与多源采购比较及订单分配研究,F224
- 基于多核环境的基因贝叶斯网络构造算法研究与实现,Q75
- 基于CUDA的正则表达式匹配系统的设计与实现,TP311.52
- 基于GPGPU的快速白光干涉测量系统研究,O439
- 群体仿真算法研究及疏散仿真系统开发,TP391.9
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|