学位论文 > 优秀研究生学位论文题录展示

GPU加速的大规模岩土工程有限元计算中的迭代求解

作 者: 李路涛
导 师: 陈曦
学 校: 北京交通大学
专 业: 岩土工程
关键词: 三维比奥固结 土-结构相互作用 有限元法 CPU-GPU混合计算 线性方程组求解 Krylov子空间迭代 预处理
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 165次
引 用: 1次
阅 读: 论文下载
 

内容摘要


岩土工程有限元分析过程中,需要进行一系列线性方程组的求解。随着工程规模的扩大、复杂性的增加、计算精度的提高,以及计算参数的多样化,计算所需要的计算量、存储量和求解时间迅速地增加,已有的串行计算平台和计算方法已无法满足实际工程的需求。图形处理器GPU最初用于图形处理方面,由于其具有较高的浮点计算性能、较大的带宽和良好的并行性能和日趋完善的可编程性,GPU通用计算正在逐渐成为科学前沿和研究热点,已在多个学科得到广泛的应用和迅速的发展。本文的研究目的是采用CPU-GPU混合计算平台进行大规模岩土工程问题的有限元求解,并利用GPU计算卡进行加速,即将矩阵-矢量相乘这一计算量最大的部分交给GPU并行计算,以此来实现线性方程组求解的加速。采用Fortran语言在PGI Visual Fortran编译器上编写了三维有限元程序,通过与Abaqus计算结果对比,验证了程序的正确性,并对两类岩土工程问题进行了测试。(1)Biot固结问题是典型的岩土工程问题,三维Biot固结方程通过有限元方法离散可以得到一系列大型线性方程组,分别采用CPU和CPU-GPU计算平台,利用广义雅克比(GJ)预处理的SQMR迭代法对其进行求解。在求解规模方面,采用了稀疏矩阵存储法,使得在个人计算机上计算规模可以达到280万个自由度;在计算效率方面,通过GPU并行加速,在台式机电脑上得到了最高2.79倍的双精度计算加速比。(2)土和结构相互作用问题的典型特点是土工材料间的弹性模量差异显著。通过桩筏基础的固结和排水分析,对最近提出的适用于土和结构相互作用问题的预处理技术进行了对比,通过CPU和CPU-GPU两种计算模式,探讨了不同预处理的计算性能差异,评价了GPU对这些预处理迭代求解方法的加速效果。

全文目录


致谢  5-6
中文摘要  6-7
ABSTRACT  7-8
目录  8-11
1 绪论  11-21
  1.1 研究背景  11-12
  1.2 并行计算现状  12-14
    1.2.1 传统的有限元并行计算  12-13
    1.2.2 GPU通用计算  13-14
  1.3 有限元并行算法现状  14-17
    1.3.1 局部并行求解法  14-15
    1.3.2 区域分解法  15-16
    1.3.3 EBE法  16-17
  1.4 计算环境  17-18
    1.4.1 软件环境  17
    1.4.2 硬件环境  17-18
  1.5 论文主要研究内容  18-21
2 基于GPU的并行计算  21-35
  2.1 引言  21
  2.2 GPU和GPU通用计算  21-23
  2.3 CUDA编程模模式  23-27
    2.3.1 CUDA概述  23-24
    2.3.2 内核(kernel)  24-25
    2.3.3 线程层次  25-26
    2.3.4 存储器层次结构和数据类型  26-27
  2.4 CUDA Fortran并行程序设计  27-33
    2.4.1 稠密矩阵乘积的设计  27-30
    2.4.2 测试结果  30-33
  2.5 本章小结  33-35
3 大型线性方程组的求解  35-57
  3.1 引言  35
  3.2 有限元方程离散的线性方程组  35-42
    3.2.1 固结理论概述  35
    3.2.2 Terzaghi一维固结理论  35-36
    3.2.3 Terzaghi-Rendulic固结理论  36-37
    3.2.4 Biot固结理论  37-42
  3.3 线性方程组的求解  42-49
    3.3.1 线性方程组的求解方法  42-45
    3.3.2 迭代预处理技术  45-47
    3.3.3 PSQMR及并行计算原理  47-49
  3.4 刚度矩阵的存储方法  49-52
    3.4.1 等带宽存储法  49-50
    3.4.2 一维变带宽存  50
    3.4.3 CSC存储法和相关的存储法  50-51
    3.4.4 EBE存储法  51-52
    3.4.5 其他存储  52
  3.5 稀疏矩阵矢量乘积  52-56
    3.5.1 稀疏矩阵-矢量乘的CPU实现(SpMV-CPU))  52-54
    3.5.2 稀疏矩阵-矢量乘GPU并行算法(SpMV-GPU1)  54-55
    3.5.3 稀疏矩阵-矢量乘GPU并行算法的改进(SpMV-GPU2)  55-56
  3.6 本章小结  56-57
4 Biot固结问题求解性能的比较  57-67
  4.1 引言  57
  4.2 PGI Fortran与Intel Fortran编译器效率比较  57-58
  4.3 求解效率对比  58-60
    4.3.1 P3dBiot程序与Abaqus软件计算效率对比  58
    4.3.2 稀疏存储法与EBE存储法比较  58-60
  4.4 基于GPU的并行计算结果  60-65
  4.5 本章小结  65-67
5 土-结构相互作用问题的预处理技术与GPU加速的迭代求解  67-77
  5.1 引言  67
  5.2 最新提出的预处理技术  67-68
    5.2.1 非精确分块对角预处理  67-68
    5.2.2 分区块SSOR预处理  68
  5.3 桩筏基础算例分析  68-75
    5.3.1 不同弹性模量对结果影响  69-72
    5.3.2 不同有限元网格划分对结果影响  72-74
    5.3.3 不同线程块划分对结果影响  74-75
  5.4 本章小结  75-77
6 总结和未来工作  77-79
  6.1 全文总结  77
  6.2 未来工作  77-79
参考文献  79-83
附录A P3DBiot固结有限元程序  83-90
  A.1 P3dBiot固结有限元程序简介  83
  A.2 计算模型参数  83-84
  A.3 主程序源代码  84-90
附录B 输入文件和输出文件  90-93
  B.1 程序数据输入文件  90-91
  B.2 程序数据输出文件  91-92
  B.3 程序与Abaqus计算结果验证  92-93
作者简历  93-97
学位论文数据集  97

相似论文

  1. 永磁磁力耦合器结构与特性研究,TH139
  2. 舌图像中瘀斑瘀点检测技术研究,TP391.41
  3. 基于时程分析法碾压混凝土重力坝抗震稳定性分析,TV642.2
  4. Cu2+/Co2+催化漂白桉木浆工艺与机理研究,TS745
  5. 离子液体预处理纤维素及再生纤维素水解研究,TQ352.1
  6. 玉米秸秆和牛粪混合厌氧发酵工艺优化研究,S216.4
  7. 智能森林灭火航弹研究,S762
  8. 液压挖掘机工作装置动力学分析及有限元优化设计,TU621
  9. 基于有限元法的某涡轮盘的疲劳可靠性灵敏度分析,V232.3
  10. 电子地图自动注记系统的设计与实现,P208
  11. 红外图像目标识别及跟踪技术研究,TP391.41
  12. 空间超光谱成像仪前置光学系统补偿调焦研究,TH743
  13. 电信计费预处理系统的优化实现,TP274
  14. 时域数值算法在无线信道分析中的应用,TN92
  15. 细菌纤维素模板效应及氧化锌光催化材料的可控制备,TB383.1
  16. 多种缺陷对红外光子晶体光纤性能影响的研究,TN253
  17. 红外空心布拉格光纤损耗特性的研究,TN253
  18. 含缺陷态光子晶体光纤特性的研究,TN253
  19. 整舱浮筏隔振系统隔振性能及声辐射特性研究,U661.44
  20. 半刚性基层沥青路面多裂纹扩展数值模拟与试验研究,U416.217
  21. “嫦娥一号”微波探测仪数据预处理与分析,V446.9

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com