学位论文 > 优秀研究生学位论文题录展示
基于CPU-GPU集群的分子动力学并行计算研究
作 者: 苏丽丽
导 师: 郭禾
学 校: 大连理工大学
专 业: 计算机系统结构
关键词: CPU-GPU集群 分子动力学 元胞列表法 区域分解法 并行计算
分类号: TP338.6
类 型: 硕士论文
年 份: 2009年
下 载: 392次
引 用: 5次
阅 读: 论文下载
内容摘要
分子动力学模拟是一种离散模拟的方法,是计算量非常庞大的一种模拟分子运动的方法。其主要是以分子的运动规律为基础,计算分子在一定时间内的运动变化情况,根据计算过程中得到的数据,进行定性和定量的分析,从而得到分子体系的各种物理性质和化学性质。现已广泛的应用于物理、化学、生物、材料、医学等各个领域。GPU专为密集型、高度并行化的计算而设计,CUDA技术的应用降低了GPU通用计算开发难度。单GPU的计算能力已经比较强大,但是对于具有实际意义的超大规模的模拟系统来说,分子量高达上千万甚至上亿,这种系统所需要的计算能力远远大于单GPU,因此发展多个GPU并行的计算体系是有一定研究和实际意义的。本文主要针对分子动力学大规模模拟系统的并行计算进行研究。搭建CPU-GPU集群并行计算平台,集群中每个计算节点都以CPU为主处理器GPU为协处理器,将并行数值计算部分由GPU完成,其余操作由CPU完成。以CUDA为开发环境,完成分子动力学模拟在此集群上的实现。提出适合GPU计算的区域分解算法—“最小表面积法”进行并行任务的划分,这是一种(元胞)静态负载平衡算法,可以一定程度的降低集群中节点间通信代价,同时采用元胞列表法作为邻近分子搜索算法,有利于在GPU上的并行计算。采用MPI消息通信机制,并提出了适合本文设计系统的消息传递方法,根据这些算法提出了适合在CPU-GPU集群上实现的并行方案。从测试数据可以看出,对于大规模分子模拟系统的计算来说,GPU的计算能力远大于CPU的计算能力,在CPU-GPU集群上的计算效率远大于CPU集群上的计算效率。同时本文也设计并实现基于FPGA的分子模拟并行系统,测试表明GPU与FPGA的实现相比也占有一定的优势。
|
全文目录
摘要 4-5 Abstract 5-9 1 绪论 9-17 1.1 分子动力学 9-13 1.1.1 分子动力学简介 9 1.1.2 势能函数 9-11 1.1.3 系统运动方程 11-12 1.1.4 分子搜索算法 12-13 1.2 国内外研究现状 13-15 1.3 本文主要研究内容 15-17 2 GPU与并行计算 17-25 2.1 GPU简介 17-19 2.1.1 GPU的发展 17-18 2.1.2 CUDA技术 18-19 2.1.3 GPU的并行计算原理 19 2.2 并行计算 19-25 2.2.1 并行算法设计 19-21 2.2.2 并行任务分解算法 21-23 2.2.3 MPI消息通信 23-25 3 集群架构与系统总体设计 25-32 3.1 集群系统架构 25-26 3.2 系统总体设计 26-32 4 CPU-GPU集群上的并行实现 32-46 4.1 运行平台的搭建 32-35 4.1.1 安装网络文件系统 32 4.1.2 MPI并行编程环境的搭建 32-35 4.1.3 CUDA安装 35 4.2 系统初始化 35-36 4.3 并行任务划分算法 36-38 4.4 GPU上的并行计算 38-46 5 实验与结果分析 46-54 5.1 单CPU与单GPU的性能比较 46-49 5.2 单GPU与FPGA的性能比较 49-50 5.3 CPU集群与CPU-GPU集群的性能比较 50-54 结论 54-56 参考文献 56-59 攻读硕士学位期间发表学术论文情况 59-60 致谢 60-61
|
相似论文
- TiO2表面纳结构对其疏水性能影响的分子动力学模拟研究,O614.411
- 不同类型亲水性结构表面修饰的聚氨酯材料与凝血十二因子九肽片段及纤维蛋白原P1片段相互作用的计算机模拟,O631.3
- 温度对Pt/Au异质外延薄膜生长影响的分子动力学模拟,O484.1
- 二维晶格失配外延铝薄膜结构弛豫的分子动力学模拟,O484.1
- 温度对Cu-Ni异质外延生长影响的分子动力学模拟研究,O611.3
- 环肽纳米管作为跨膜水通道的分子设计,TB383.1
- 细胞色素P450中配体进出通道和协同效应的研究,Q559.9
- 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
- 基于多核计算平台的视频压缩算法研究,TN919.81
- 基于GPU的有限元方法研究,O241.82
- 射频波注入磁化等离子体的数值模拟,TL612
- 新型电网广域后备保护的算法研究,TM774
- 保护在线自适应整定的研究,TM77
- 云环境下MapReduce容错技术的研究,TP302.8
- 不同电性纳米碳管共价修饰FAD的分子动力学模拟研究,TB383.1
- 高动态SINS导航解算算法及其并行化研究,TN966
- 图像检索的并行计算方法与系统,TP391.3
- GPU加速的粒子滤波PET图像重建算法,TP391.41
- 基于GPU的时间序列并行检索算法研究,TP391.41
- 基于CPU的源强反算算法研究,TP18
- 双晶铜晶界能及其结构稳定性的分子动力学模拟,TG142.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com
|