学位论文 > 优秀研究生学位论文题录展示

提高机群OpenMP系统性能的关键技术研究

作 者: 章隆兵
导 师: 胡伟武
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机系统结构
关键词: 机群系统 OpenMP 机群OpenMP系统 软件分布式共享存储 数据分布 循环调度算法 JIAJIA
分类号: TP338
类 型: 博士论文
年 份: 2004年
下 载: 311次
引 用: 2次
阅 读: 论文下载
 

内容摘要


随着微处理器和高速网络技术的发展,机群由于性能价格比高和可扩展性好等特点,正逐渐成为并行计算的主流平台。适合机群的并行编程模型能够促进机群的广泛应用,从而促进并行应用的发展普及,成为当前关注热点。目前消息传递是机群上主流的并行编程模型。但是程序员在机群上使用消息传递编程相当困难,这一点阻碍了机群的广泛应用。一般认为,共享存储比消息传递易于编程。OpenMP作为当前共享存储的事实编程标准,具有易于编程和支持增量并行的特点。机群OpenMP系统在机群上提供了共享存储的OpenMP计算环境,它结合了OpenMP的易编程性和机群的可扩展性,引起了广泛的研究。由于机群通常采用廉价的商业网络互连,通信开销较大,机群OpenMP系统要想获得理想的性能较为困难,而具有良好的性能是它能否得到广泛应用的关键,因此如何有效提高机群OpenMP系统的性能成为当前研究热点。 本文研究了提高机群OpenMP系统性能的关键技术,并利用扩展OpenMP制导的方式进行了实现。机群OpenMP系统通过将OpenMP程序转换成软件DSM程序在机群上运行。基于Home的软件DSM系统在机群上构造了类似NUMA结构的共享存储抽象,针对这个特点,并借鉴了HPF语言,本文提出了数据分布制导扩展和充分利用拥有者计算原则的基于局部性的循环调度模式LBS和LBDS。由于数据分布制导扩展只适用于访存规则的程序,对于访存非规则的应用起不到作用。针对采用稀疏矩阵运算的一大类非规则应用,本文提出了indirect制导扩展以改善该类应用的性能。 本文对所提出的制导扩展进行了应用评测。测试结果表明使用这些制导扩展编程,既保持了OpenMP的易编程性,编程难度与循环级编程方式相似,又获得了与SPMD编程方式相当的性能,是机群上一种有效的编程方式。为了评价改进后机群OpenMP系统性能,本文在PC机群上将机群OpenMP系统OpenMP/JIAJIA与目前机群上主流的消息传递库MPI进行了比较。比较结果表明:在8个处理机运行时,相对于所测试的七个应用,机群OpenMP系统获得了相当于MPI的81%的性能。这个结果在一定程度上反映了机群OpenMP系统获得了与MPI可比的性能,但是采用OpenMP编程却比MPI要容易得多。

全文目录


摘要  4-5
Abstract  5-7
目录  7-10
第一章 绪论  10-17
  1.1 并行处理系统  10-12
  1.2 并行编程模型  12-13
    1.2.1 消息传递  12
    1.2.2 共享存储  12-13
    1.2.3 两种模型比较  13
  1.3 机群OpenMP系统  13-14
  1.4 相关工作  14-15
  1.5 本文工作  15-16
  1.6 论文的组织  16-17
第二章 机群OpenMP系统—OpenMP/JIAJIA  17-36
  2.1 OpenMP介绍  17-23
    2.1.1 独孤制导  17-18
    2.1.2 执行模型  18
    2.1.3 OpenMP C/C++ API 2.0  18-23
    2.1.4 OpenMP的未来  23
  2.2 JIAJIA介绍  23-30
    2.2.1 存储组织方式  24-26
    2.2.2 基于锁的Cache一致性协议  26-29
    2.2.3 JIAJIA的编程接口  29
    2.2.4 JIAJIA的具体实现  29-30
  2.3 OpenMP/JIAJIA介绍  30-34
    2.3.1 OpenMP/JIAJIA结构  30-31
    2.3.2 OMP2JIA翻译器  31-32
    2.3.3 支持fork/join模式的JIAJIA库  32-34
  2.4 OpenMP的编程方式  34-36
第三章 数据分布制导  36-42
  3.1 OpenMP的隐式数据分布策略  36-37
  3.2 适合NUMA结构的数据分布制导扩展  37-38
  3.3 适合机群的数据分布制导扩展  38-40
  3.4 小结  40-42
第四章 高效循环调度算法  42-60
  4.1 OpenMP的调度模式  42-43
  4.2 LBS调度算法  43-50
    4.2.1 设计考虑  43-44
    4.2.2 LBS算法描述  44-47
    4.2.3 理论分析  47-49
    4.2.4 应用测试  49-50
  4.3 LBDS调度算法  50-59
    4.3.1 设计考虑  50-51
    4.3.2 LBDS算法描述  51-53
    4.3.3 理论分析  53-55
    4.3.4 应用测试和分析  55-59
  4.4 小结  59-60
第五章 针对非规则应用的制导扩展  60-67
  5.1 制导扩展  60-61
  5.2 具体实现  61-63
    5.2.1 JIAJIA的接口扩展  61-62
    5.2.2 实现问题及系统修改  62-63
  5.3 应用测试  63-65
  5.4 相关工作  65
  5.5 小结  65-67
第六章 性能比较与分析  67-76
  6.1 测试程序及测试平台  67-69
    6.1.1 测试程序介绍  67-69
    6.1.2 测试平台  69
  6.2 采用制导扩展编程vs SPMD方式  69-71
  6.3 OpenMP vs MPI  71-75
    6.3.1 测试结果总体分析  72-73
    6.3.2 应用在8个处理机时的并行性能比较和分析  73-75
  6.4 小结  75-76
第七章 总结和未来工作  76-78
  7.1 本文工作总结  76-77
  7.2 未来研究方向  77-78
参考文献  78-82
博士后工作期间发表的论文和参与的项目 #ⅰ  82-83
致谢  83

相似论文

  1. 基于云计算的分布式智能语义搜索方法研究,TP391.1
  2. 基于OpenMP的遗传退火算法的并行化,TP301.6
  3. 多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41
  4. FDTD与MPSTD并行算法在电磁散射中的应用研究,O441.4
  5. BSD协议栈性能分析和并行优化,TP393.04
  6. 软件优化技术在软件开发项目中的应用研究,TP311.52
  7. 海量空间数据的分布式存储管理及并行处理技术研究,TP333
  8. 基于MPI和OpenMP的三维FDTD并行算法的研究,TN011
  9. 电网调度中心在线数据整合的研究和实践,TM73
  10. 月球科学数据编目处理与集成管理技术研究,V446.9
  11. 基于H.264/AVC的视频编码器设计与优化,TN762
  12. 并行小波高速计算研究及其在电力系统中的应用,TP338
  13. 多纹理图像分割并行算法研究与实现,TP391.41
  14. OpenMP并行编程模型与性能优化方法的研究及应用,TP311.11
  15. 基于任务并行策略的多核程序优化研究,TP332
  16. 基于正交变换和安全点积的隐私保护支持向量机研究,TP18
  17. 多核模式下地震勘探并行计算研究,TP338.6
  18. 多核技术在网络入侵检测中的应用研究,TP393.08
  19. 基于机群技术的中尺度数值气象预报监控管理系统的研究与实现,TP311.52
  20. 基于多核系统的程序优化技术的研究,TP332
  21. 不确定数据聚集查询的分布式处理算法,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机
© 2012 www.xueweilunwen.com