学位论文 > 优秀研究生学位论文题录展示
数据分布和收集代码自动生成及优化技术研究
作 者: 杜澎
导 师: 赵荣彩
学 校: 解放军信息工程大学
专 业: 计算机应用技术
关键词: 程序并行化 分布存储计算机系统 消息传递 代码生成 数据分布 精确数据收集 冗余并行执行模型(RPEM)
分类号: TP314
类 型: 硕士论文
年 份: 2007年
下 载: 31次
引 用: 2次
阅 读: 论文下载
内容摘要
并行化编译技术是指通过多种技术手段自动检测串行程序中潜在的并行性,并将串行程序转换为等价的高效并行程序的翻译技术。可分为并行识别和并行代码自动生成两大关键部分,其中并行代码的自动生成就是利用代码生成前端提供的信息产生适合目标结构的并行代码,并行代码的结构对所生成的并行程序的运行效率起着至关重要的作用。本文主要研究了分布内存体系结构的并行代码生成技术及相关优化算法。论文首先对传统的数据分布和收集算法进行了研究与技术实现,然后利用计算划分和终写关系分析提供的信息实现了精确的数据收集,减少了通信次数和每次通信的数据量,提高了所生成的并行程序的效率。文章还在分析冗余并行执行模型(RPEM)的基础上,对其进行了改进,消除了不必要的数据分布,精简了模型结构,并进一步对数据分布和收集算法进行了优化。最后,对文中所提的算法和优化方法的正确性和效率进行了测试,并对测试结果进行比较分析。测试结果表明文中所提算法是正确的,优化后的程序相对优化前性能有较显著的提高。
|
全文目录
表目录 6-7 图目录 7-8 摘要 8-9 ABSTRACT 9-10 第一章 绪论 10-17 1.1 并行化编译研究的意义及难点 10-12 1.2 并行化编译目标机体系结构分类 12-13 1.2.1 共享内存结构 12-13 1.2.2 分布内存结构 13 1.3 两种并行编程模型 13-16 1.3.1 共享内存编程模型和OpenMP 13-14 1.3.2 消息传递编程模型和MPI 14-16 1.4 论文的主要工作和组织安排 16 1.5 基本概念、术语及约定 16-17 第二章 研究背景和基础知识 17-23 2.1 并行化识别工具S-KAP 17-19 2.2 SUIF简介 19 2.3 线性不等式组描述 19-22 2.3.1 利用线性不等式组生成循环嵌套 20-21 2.3.2 符号系数线性不等式组 21-22 2.4 小结 22-23 第三章 数据分布、数据收集的代码生成 23-42 3.1 计算与数据划分 23-25 3.1.1 数据划分 23-24 3.1.2 计算划分 24-25 3.2 冗余并行执行模型 25-26 3.3 通信集的建立 26-31 3.3.1 计算前发送通信集 27-29 3.3.2 计算前接收通信集 29-30 3.3.3 数据分布和数据收集通信集 30-31 3.4 基于符号系数不等式产生数据分布、收集代码的算法及实现 31-40 3.4.1 数据分布算法 31-32 3.4.2 数据收集算法 32-34 3.4.3 数据分布算法和收集算法实例 34-40 3.5 数据一致性算法 40-41 3.6 小结 41-42 第四章 精确数据收集及优化 42-56 4.1 精确数据流分析 42-44 4.2 终写关系分析 44-47 4.2.1 输出依赖分析 44-45 4.2.2 写引用分析 45-47 4.3 精确数据收集的算法及实现 47-54 4.3.1 精确数据收集算法 47-48 4.3.2 精确数据收集算法的实例 48-53 4.3.3 精确数据收集测试 53-54 4.4 数据分布的优化 54-55 4.5 小结 55-56 第五章 测试结果与分析 56-59 5.1 测试环境 56-57 5.1.1 测试平台 56 5.1.2 测试步骤 56-57 5.1.3 测试用例 57 5.2 测试结果及分析 57-58 5.2.1 测试结果 57-58 5.2.2 测试结果分析 58 5.3 小结 58-59 结束语 59-60 参考文献 60-62 作者简历 攻读硕士学位期间完成的主要工作 62-63 致谢 63
|
相似论文
- 基于模型的设计在ARM直流电机控制开发中的应用,TM33
- 基于云计算的分布式智能语义搜索方法研究,TP391.1
- 基于压缩感知图像恢复算法的研究,TP391.41
- SOA中服务与服务组合的形式化研究,TP393.09
- 基于业务驱动的数据交换平台的设计与研究,TP311.52
- 分布存储结构的通信代码自动生成与优化,TP311.11
- 基于模型集成计算的面向领域开发方法研究,TP311.52
- 海量空间数据的分布式存储管理及并行处理技术研究,TP333
- 基于LBM的两相流数值模拟及其并行算法的实现,O359
- 月球科学数据编目处理与集成管理技术研究,V446.9
- 广域网多级集群环境下的MPI扩展研究,TP393.2
- 基于消息中间件的订阅/发布系统的研究与设计,TP311.52
- 电大导体目标宽带RCS快速计算的关键技术研究,TN011
- 轻量级单点登录系统的设计与实现,TP311.52
- MOM关键技术的研究与实现,TP338.8
- 遗传连锁群中分子标记排序研究,TP18
- 基于正交变换和安全点积的隐私保护支持向量机研究,TP18
- 基于MPI的并行蚁群算法研究,TP301.6
- DS-UWB系统伪码迭代捕获方法设计与实现,TN925
- 串行程序并行化及其在桌面网格中的应用,TP311.11
- .NET平台下的插件式信息系统的研究与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 编译程序、解释程序
© 2012 www.xueweilunwen.com
|