学位论文 > 优秀研究生学位论文题录展示
面向MPI程序的进程数据相似性分析与优化技术
作 者: 刘福东
导 师: 杨学军
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: MPI 数据相似性 多核处理器 SUIF 编译优化 MPI-Optimizer
分类号: TP311.11
类 型: 硕士论文
年 份: 2010年
下 载: 46次
引 用: 1次
阅 读: 论文下载
内容摘要
近年来,随着半导体工艺和体系结构的不断发展,采用共享存储结构的多核处理器已经成为通用微处理器的主流发展方向,并迅速地在高性能并行计算机领域得到广泛应用。MPI(Message Passing Interface)是并行计算机中使用最为广泛的编程模型之一,很多领域中均存在大量的MPI应用程序。然而,研究表明,传统MPI程序中大量存在这样一类数据,当程序执行时,多个进程虽然私有访问该数据在各自进程中的副本,但访问的值是相同的,这使得多个进程对该数据的访问具有相似性,传统MPI程序在执行时需要为每个进程创建一个该数据的副本,这极大地加剧了系统中共享存储资源的竞争,导致传统MPI程序在以多核处理器为代表的共享存储结构并行计算机上的运行效率面临巨大挑战。为了避免传统MPI程序进程访问数据的相似性对程序执行性能的影响,本文主要从以下三个方面开展了研究工作:首先,本文给出了相似数据的定义,通过大量分析传统MPI程序中相似数据的特征,提出了一种共享相似数据的优化方法,同时,利用开源编译器SUIF2系统设计了一个相似数据编译优化方法的基本框架,该框架在总体上给出了相似数据的优化思路,为自动化地实现相似数据编译优化奠定了基础。其次,本文建立了相似数据共享竞争的分析模型,定义了相似数据共享竞争以及共享竞争错误等重要概念,详细分析了相似数据共享竞争对共享相似数据MPI程序的诸多影响,提出并证明了保证共享相似数据MPI程序执行时无相似数据共享竞争错误的条件,并利用栅栏同步和私有化机制给出了满足程序执行时无相似数据共享竞争错误条件的优化规则,同时,扩展了现有的MPI编程模型,该模型能够标识出所有在相似数据编译优化过程中需要的信息,为自动化地实现相似数据的编译优化提供了支持。最后,本文设计了一个相似数据编译优化的工具——MPI-Optimizer,并结合操作系统中的共享内存机制、动态内存分配机制以及现有MPI编程模型中的同步机制,利用SUIF2系统提供的相关类和方法具体实现了MPI-Optimizer,从而自动化地完成了传统MPI程序中相似数据的编译优化。实验结果表明,本文扩展的MPI编程模型一种正确有效的编程模型,设计并实现的相似数据编译优化工具MPI-Optimizer能够显著地减少传统MPI程序在以多核处理器为代表的共享存储结构并行计算机上运行时的内存使用量,降低了Cache的失效率,提高了程序的执行效率。
|
全文目录
摘要 9-10 ABSTRACT 10-12 第一章 绪论 12-24 1.1 课题研究背景 12-21 1.1.1 典型的并行计算机体系结构 12-17 1.1.2 多核处理器的产生及发展 17-18 1.1.3 MPI程序的进程数据相似性 18-19 1.1.4 相似数据的编译优化 19-21 1.2 相关研究工作 21-22 1.3 课题研究内容与创新 22-23 1.4 论文结构 23-24 第二章 相似数据编译优化方法的基本框架 24-30 2.1 优化方法 24-25 2.2 SUIF2 系统 25-27 2.3 基本框架 27-29 2.3.1 总体思路 27 2.3.2 基本框架 27-28 2.3.3 开发策略 28-29 2.4 小结 29-30 第三章 相似数据共享竞争的分析模型 30-52 3.1 基本定义 30-34 3.2 相似数据共享竞争的分析 34-40 3.2.1 相似序列内的相似数据共享竞争分析 35-36 3.2.2 非相似序列内的相似数据共享竞争分析 36-38 3.2.3 相似序列与非相似序列间的相似数据共享竞争分析 38-40 3.3 保证无相似数据共享竞争错误的条件 40-46 3.3.1 保证相似序列内无相似数据共享竞争错误的条件 40-42 3.3.2 保证非相似序列内无相似数据共享竞争错误的条件 42-45 3.3.3 保证相似序列与非相似序列间无相似数据共享竞争错误的条件 45-46 3.4 优化规则 46-49 3.4.1 保护措施 46-47 3.4.2 优化规则 47-49 3.5 扩展后MPI编程模型 49-50 3.6 小结 50-52 第四章 相似数据编译优化工具的设计与实现 52-68 4.1 动态内存分配机制 52-53 4.2 共享内存机制 53-55 4.3 总体设计 55-59 4.4 基于SUIF2 技术的工具实现 59-67 4.4.1 总体实现 60-61 4.4.2 VariableSymbol对象的转换实现 61-63 4.4.3 Expression对象的转换实现 63-65 4.4.4 Statement对象的转换实现 65-67 4.5 小结 67-68 第五章 实验验证及结果分析 68-76 5.1 实验方法 68-69 5.1.1 Intel Vtune概述 68 5.1.2 实验平台 68-69 5.2 矩阵乘程序测试及结果分析 69-72 5.2.1 MM(Matrix Multiplication)程序描述 69 5.2.2 测试结果及分析 69-72 5.3 Jacobi迭代程序测试及结果分析 72-75 5.3.1 JI(Jacobi Iteration)程序描述 72 5.3.2 测试结果及分析 72-75 5.4 小结 75-76 第六章 结束语 76-79 6.1 工作总结 76-77 6.2 研究展望 77-79 致谢 79-81 参考文献 81-86 作者在学期间取得的学术成果 86
|
相似论文
- TD-SCDMA无线链路控制协议实现研究,TN929.533
- 多核系统中基于温度限制的节能调度算法研究,TP332
- 分布式内存多核处理器流程序虚拟机研究,TP333.1
- 过载虚机条件下MPI通信性能改善方法研究,TP302
- 基于TILE Pro64多核处理器的3G服务器视频转码软件设计,TP393.05
- 基于TilePro64多核处理器的H.264高清视频解码软件设计,TN919.81
- 基于GALS的多核互连及任务调度策略研究,TN47
- 基于共享前端的流多核体系结构关键技术研究,TP332
- 基于群智能和冲突规避策略的基因—基因交互作用检测及其并行计算,TP391.41
- 多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41
- 高性能低功耗多核处理器研究,TP332
- DTMB中3780点FFT在多核DSP平台上的实现,TP368.1
- FDTD与MPSTD并行算法在电磁散射中的应用研究,O441.4
- 铜带剪切线张力控制系统及应用,TG333.21
- 门控心肌灌注显像在冠状动脉搭桥术前后的临床应用研究,R654.2
- 环境卫星光学影像自动配准算法研究与并行实现,TP391.41
- 嵌入式MSDCC异构多核编译器研究,TP314
- GPS掩星资料处理的GPU并行算法研究,TP391.41
- 面向软件事务存储的内存管理技术研究与实现,TP333.1
- SIMD数据置换指令的自动生成与优化,TP332
- 基于MPI和OpenMP的三维FDTD并行算法的研究,TN011
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 程序设计方法
© 2012 www.xueweilunwen.com
|