学位论文 > 优秀研究生学位论文题录展示

基于GPU的硬件加速方法在粒子模拟中的应用

作 者: 高强
导 师: 杨中海
学 校: 电子科技大学
专 业: 电子科学与技术
关键词: 粒子模拟 GPU 并行算法 CUDA
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 97次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着计算机性能的飞速发展,人们渴望能够更加精确的模拟等离子体的特性。为此全三维相对论的粒子模拟逐渐被提出来,引入的宏粒子数目达到106~1010个,这使得PIC模拟消耗的计算机资源(包括计算机内存以及计算时间)呈数量级的增长,为了解决庞大的计算负担,开发相应的并行PIC模拟算法非常重要。并行PIC模拟的很多成熟算法都基于传统体系结构的中央处理器(CPU),但是CPU的有限资源成为计算瓶颈。过去的十年里,一种新的大规模并行处理器——GPU(Graphic Processing Unit,图形处理器)开始被应用到科学计算领域。本文第一章介绍了等离子体粒子模拟的发展概况以及在计算中所面临的问题。GPU的发展历程和应用于并行计算的发展概况。本文第二章介绍了一种将GPU视作数据并行计算设备的软硬件体系——CUDA统一计算设备架构。详细的描述了在分析问题的过程中对计算任务进行粗粒度和细粒度的方法,以及CUDA模型中大规模的并行线程在GPU硬件中的映射方法、调度执行方式。本文第三章以模拟多环形电子注在圆柱系统中的运动轨迹为例介绍了等离子体的粒子模拟方法。其中理论分析包括:电子运动方程的求解、电荷源的求解以及Poisson方程的求解三个部分。由于电子注的环形特征以及圆柱系统的轴对称性,采用圆柱坐标系及该坐标系下的网格划分来进行理论分析和数值模拟。本文第四章结合第二、三章的介绍,分析了PIC模拟在GPU上的可行性,提出了总体的实现流程。把整个计算分为了带电粒子运动求解,网格点电势更新,电荷密度求解,其中将电荷密度算法修改使其可以用原子函数来计算,避免了内存写入冲突。给出了它们数据并行处理的CUDA实现方案,并与CPU串行程序进行了对比,得到了较高的精确度和10倍的加速比。

全文目录


摘要  4-5
ABSTRACT  5-9
第一章 绪论  9-15
  1.1 粒子模拟概述  9
  1.2 图形处理器通用计算的发展概述  9-13
  1.3 本文的研究工作及贡献  13
    1.3.1 本文的研究工作内容  13
    1.3.2 研究贡献  13
  1.4 本文内容安排  13-15
第二章 CUDA 介绍  15-37
  2.1 引言  15
  2.2 CUDA 软件实现  15-27
    2.2.1 CUDA C 语言  15-16
    2.2.2 CUDA 存储器结构  16-21
    2.2.3 线程层次结构  21-24
    2.2.4 CUDA 编程环境  24-27
  2.3 CUDA 的硬件实现方法  27-35
    2.3.1 G80/GT200 及Fermi 架构介绍  27-32
    2.3.2 并行执行模型  32-35
  2.4 CUDA 性能优化  35-36
  2.5 小结  36-37
第三章 圆柱体中粒子轨迹的PIC 模拟  37-49
  3.1 引言  37-38
  3.2 电荷源的求解  38-39
  3.3 Poisson 方程的求解  39-41
  3.4 电子运动方程的求解  41-45
  3.5 模拟流程  45-47
  3.6 模拟结果  47-48
  3.7 小结  48-49
第四章 GPU 技术在PIC 模拟中的应用  49-62
  4.1 引言  49-50
  4.2 电子运动求解算法在CUDA 上的并行实现  50-52
    4.2.1 电子运动求解算法在CUDA 上的并行移植分析  50-51
    4.2.2 电子运动求解算法的CUDA 实现与测试结果  51-52
  4.3 电荷密度更新算法在CUDA 上的并行实现  52-55
    4.3.1 电荷密度更新算法在CUDA 上的并行移植分析  52-54
    4.3.2 电荷密度更新算法在CUDA 上的实现与测试结果  54-55
  4.4 电场更新算法在CUDA 上的并行实现  55-57
    4.4.1 电场更新算法在CUDA 上的并行移植分析  55-56
    4.4.2 电场更新算法在CUDA 上的实现与测试结果  56-57
  4.5 总体实现及结果分析  57-61
  4.6 小结  61-62
第五章 总结  62-63
致谢  63-64
参考文献  64-66
攻硕期间取得的研究成果  66-67

相似论文

  1. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  2. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  3. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  4. 基于GPU的有限元方法研究,O241.82
  5. 微放电通道的径向扩展与放电均匀性的研究,TM83
  6. 基于图形处理器的SIFT算法研究,TP391.41
  7. 基于CUDA的正则表达式匹配系统的设计与实现,TP311.52
  8. 基于GPU图像搜索中文本检索的关键技术研究,TP391.1
  9. 基于GPU/CPU多级并行CFD优化策略的研究,V221
  10. GPU加速的仿射算术在几何设计中的应用研究,TP391.41
  11. 基于GPGPU的快速白光干涉测量系统研究,O439
  12. 基于ffmpeg的高性能高清流媒体播放器软件设计,TN919.8
  13. 增强现实系统中火焰特效关键技术研究,TP391.9
  14. 基于多图形处理器的高效波动声学模拟器及其应用,TP391.41
  15. 群体仿真算法研究及疏散仿真系统开发,TP391.9
  16. GPU加速的粒子滤波PET图像重建算法,TP391.41
  17. 基于GPU的图书推荐系统研究与实现,TP391.3
  18. 基于GPU加速的一种线性规划算法及其应用,TP391.41
  19. 基于CUDA的视频火灾检测系统,TP391.41
  20. 基于GPU的时间序列并行检索算法研究,TP391.41
  21. 基于CPU的源强反算算法研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com